إليك ما يجب أن تعرفه عن جيميني: نموذج الذكاء الاصطناعي الجديد من جوجل

3 دقائق
إليك ما يجب أن تعرفه عن جيميني: نموذج الذكاء الاصطناعي الجديد من جوجل
حقوق الصورة: جوجل
استمع الى المقالة الآن هذه الخدمة تجريبية
Play Audio Pause Audio

كشفت جوجل في 6 ديسمبر/كانون الأول عن مشروعها “الأحدث والأكثر طموحاً” في مجال الذكاء الاصطناعي، نموذج جيميني (Gemini)، وهو نموذج ذكاء اصطناعي تهدف من خلاله جوجل إلى التفوق في هذا المجال وتحقيق أداء يقترب من الأداء البشري في مجموعة واسعة من المهام.

يأتي هذا الحدث كمحاولة من جوجل للحاق بشركة أوبن أيه آي (OpenAI)، التي احتفلت قبل أيام بالذكرى السنوية الأولى لإطلاق بوت الدردشة الأشهر في العالم تشات جي بي تي (ChatGPT).

جيميني: نموذج ذكاء اصطناعي لن يكون متاحاً في أوروبا

طرحت جوجل الإصدار الأولي من جيميني على هيئة ترقية لبوت الدردشة بارد (Chatbot Bard) باللغة الإنجليزية فقط، وسيكون النموذج متوفراً في أكثر من 170 دولة وإقليماً، إلّا أنه لن يكون متاحاً في المملكة المتحدة وأوروبا حتى الحصول على موافقة الجهات التنظيمية.

وبدءاً من 13 ديسمبر/كانون الأول، يمكن للمطورين والعملاء استخدام جيميني برو على سحابة جوجل من خلال واجهة برمجة تطبيقات جوجل استوديو للذكاء الاصطناعي التوليدي (Google Generative AI Studio) أو فيرتيكس أيه آي (Vertex AI)، أي يمكن للمطورين دمج جيميني واستخدامه في تطبيقاتهم الخاصة، وهو أحد مميزاته عن النماذج الأخرى التي تسمح بوصول محدود للمطورين.

يقول الرئيس التنفيذي لجوجل، سوندار بيتشاي (Sundar Pichai)، إنه لا بُدَّ من طرح جيميني بلغات متعددة في نهاية المطاف، ودمجه في محرك بحث جوجل ومنتجاتها الإعلانية ومتصفح كروم.

يتوفر النموذج الجديد في 3 إصدارات:

  • نانو (Nano): الإصدار الخفيف، والمخصص للتشغيل على أجهزة أندرويد.
  • برو (Pro): الإصدار المتوسط الحجم، وذو الإمكانات المتوسطة، وهو العمود الفقري لبارد بدءاً من اليوم. كما دمجت جوجل نسخة مخصصة من جيميني برو في نسخة جديدة من الأداة التوليدية للبرامج من ديب مايند، ألفا كود (AlphaCode)، لتعزيز وظائفه.
  • ألترا (Ultra): الإصدار الأكثر تطوراً، وهو أقوى النماذج اللغوية الكبيرة من جوجل، وما زال هذا الإصدار قيد التجريب حتى الآن، حيث سيُدمج في أوائل العام المقبل في إصدار بارد تحت مسمى بارد أدفانسد (Bard Advanced). ويعمل ألترا على تشغيل أداة ألفاكود 2 (AlphaCode2) لكتابة التعليمات البرمجية، والتي تعتقد جوجل بتفوقها على 85% من مبرمجي الكمبيوتر.

اقرأ أيضاً: ما هو نموذج الذكاء الاصطناعي جيميني الذي ستُطلقه جوجل وتدّعي أنه سيتفوق على تشات جي بي تي؟

مزايا جيميني

يستخدم جيميني نماذج لغوية كبيرة، بهدف تحسين فهم النموذج للغة وتحسين قدرته على التفاعل بطرق طبيعية ومفيدة مع المستخدمين، مثل صياغة رسائل البريد الإلكتروني وكلمات الأغاني أو المقالات الإخبارية. بالإضافة إلى ذلك، من المتوقع أن يعمل جيميني مساعداً لمهندسي البرمجيات في كتابة التعليمات البرمجية وإنشاء الصور بناءً على طلب المستخدم.

كما يمكن لمالكي هواتف جوجل بيكسل 8 برو (Pixel 8 Pro) الآن الاستفادة من إصدار نانو، إذ من المقرر أن تشمل ميزات الذكاء الاصطناعي أكثر من 20 تطبيقاً جديداً على هذا الهاتف، بما في ذلك ملخص المحتوى من الرسائل الصوتية.

في فيديو ترويجي لها، أظهرت جوجل قدرة نموذج ألترا على فهم إجابات واجبات الفيزياء المنزلية المكتوبة بخط اليد، وتقديم نصائح حول كيفية حل الأسئلة. وفي فيديو آخر، وضّحت قدرة إصدار برو على تحديد اسم فيلم عُرض مقطع منه -وذكر اسم المشهد أيضاً- على هاتف ذكي. 

أشار الرئيس التنفيذي لديب مايند،  ديميس هاسابيس (Demis Hassabis)، إلى أن إصدار ألترا تفوق على نماذج الذكاء الاصطناعي المتطورة، بما في ذلك نموذج جي بي تي-4 (GPT-4)، في 30 من أصل 32 اختباراً قياسياً بما في ذلك الاستدلال وفهم الصورة. وتفوق على الإصدار المجاني من جي بي تي 3.5 (GPT-3.5)، في ستة اختبارات من أصل ثمانية. 

أمّا عند مقارنته بالبشر، كان ألترا جيميني أول نموذج ذكاء اصطناعي يتفوق على الخبراء، محققاً نتيجة 90% في اختبار “معيار الفهم متعدد اللغات” (MMLU)، الذي يتضمن 14,000 اختبار اختيار من متعدد يغطي 57 موضوعاً بما في ذلك الرياضيات والفيزياء والقانون والطب والأخلاق.

اقرأ أيضاً: ما الذي نعرفه عن بوت «بارد» الذي تضع جوجل آمالها عليه لهزيمة مايكروسوفت؟

جيميني نموذج متعدد المهام

وفقاً لبيتشاي، صُمِم جيميني من الألف إلى الياء ليكون متعدد المهام، ما يعني أنه يمكنه التعميم والاستدلال، ودمج أنواع مختلفة من المعلومات بما في ذلك النصية والتعليمات البرمجية والصوت والصورة والفيديو.

عادة ما تنشأ النماذج المتعددة المهام من خلال الجمع بين نماذج منفصلة يتخصص كلٌّ منها في نوعٍ واحدٍ نوع البيانات، إلّا أن هذه الطريقة تعتبر دون المستوى الأمثل لأنها لا تدمج بشكلٍ كامل أنواع البيانات المختلفة من البداية.

اقرأ أيضاً: أصبح بإمكانك الدردشة الآن مع تشات جي بي تي باستخدام الصوت والصورة

التحديات التي يواجهها جيميني

على الرغم من المزايا التي يعد بها جيميني، فإنه ما زال يواجه بعض التحديات، مثل:

  • مشكلة “الهلوسة” أو الإجابات الخاطئة، وفقاً لما أشار إليها رئيس قسم المنتجات في جوجل ديب مايند، إيلي كولينز (Eli Collins).
  • يمكن لإصدارات نانو وبرو التي أُطلقت هذا الشهر التعامل مع مجموعة متنوعة من المدخلات، لكن استجاباتهم تقتصر حالياً على النص أو الكود.
  • حذّر بعض الخبراء، بمن فيهم عرابي التكنولوجيا جيفري هينتون (Geoffrey Hinton) ويوشوا بينجيو (Yoshua Bengio) من تطور الذكاء الاصطناعي العام، الذي يمكنه أداء مجموعة من المهام على مستوى الذكاء البشري أو فوق مستوى الذكاء البشري.

قال بيتشاي: “يمثّل هذا العصر الجديد من النماذج أحد أكبر الجهود العلمية والهندسية التي قمنا بها كشركة. أنا متحمس حقاً لما ينتظرنا، وللفرص التي سيفتحها جيميني للناس في كل مكان”.