جامعة محمد بن زايد للذكاء الاصطناعي تغيّر مشهد النماذج اللغوية الكبيرة في المنطقة

حقوق الصورة: جامعة محمد بن زايد للذكاء الاصطناعي

استمع الى المقالة الآن هذه الخدمة تجريبية

أستطيع أن أُخمّن أنك فكرت مؤخراً في الطريقة التي سيتغيّر بها مجال عملك في الشهور القادمة بعد الثورة الأخيرة في تطوير النماذج اللغوية الكبيرة، وعلى وجه الخصوص، منذ إطلاق تشات جي بي تي، بوت الدردشة القائم على نموذجي جي بي تي 3.5 وجي بي تي 4. وبالفعل، فقد بدأ الذكاء الاصطناعي التوليدي بالتوغل في قطاعات متعددة مثل الصحة والتعليم والاقتصاد وحتى التغيّر المناخي، إضافة إلى فوائده الاقتصادية، إذ كشف تقرير صادر عن شركة ماكنزي آند كومباني (McKinsey & Company)، أن الذكاء الاصطناعي التوليدي يمكن أن يحقق فوائد اقتصادية سنوية تتراوح بين 2.6 تريليون دولار إلى 4.4 تريليون دولار.

ومثل أي ابتكار جديد، لا يزال بعض المخاوف والمخاطر تحيط بهذه النماذج سواء من ناحية الدقة والموثوقية، أو الأمان، أو حتى التأثير البيئي، غير أن هناك مؤسسات كبرى بذلت جهوداً لمراجعة هذه المخاوف ومحاولة إيجاد حلول لها، مثل جامعة محمد بن زايد للذكاء الاصطناعي (MBZUAI) باعتبارها أولَ جامعة بحثية للدراسات العليا في العالم مخصصة للذكاء الاصطناعي، والتي أثبتت ريادتها في مجال حلول الذكاء الاصطناعي المفتوحة المصدر منذ إنشائها، سواء من خلال جهودها البحثية، أو شراكاتها مع المؤسسات الكبرى، أو إطلاق نماذج لغوية كبيرة رائدة باللغتين العربية والإنجليزية.

كانت الجامعة مشاركاً أساسياً في مشهد تطوير الذكاء الاصطناعي وتوسيع استخداماته، بما في ذلك النماذج التوليدية، إذ كانت شريكاً في تطوير نموذج ميتا الأخير لاما 2 “Llama 2″، عبر تقديم تعليقات مبكرة قبل إطلاق النسخة النهائية، بالمشاركة مع 50 مؤسسة أخرى دعتها ميتا إلى تقييم النموذج قبل إصداره.

يقول رئيس قسم معالجة اللغات الطبيعية في جامعة محمد بن زايد للذكاء الاصطناعي، البروفيسور بريسلاف ناكوف، إن الإصدار الثاني من لاما 2 (Llama 2) تم تحسينه بصورة كبيرة مقارنة بلاما 1 ( Llama 1) من حيث الحجم والبصمة الكربونية للنموذج.

أسهمت جامعة محمد بن زايد للذكاء الاصطناعي في تطوير عددٍ من النماذج اللغوية الرائدة مؤخراً، وهي جيس (Jais)، وفيكونا (Vicuna)، ولا ميني (LaMini)، بهدف وضع حلول لأبرز التحديات المتعلقة بالنماذج اللغوية، مثل عدم قدرة النماذج على التأكد من صحة المعلومات وتقديم معلومات خاطئة مكتوبة بلغة سليمة، والتكلفة الاقتصادية والبيئية، وقصور النماذج العربية بسبب نقص المحتوى العربي عبر الإنترنت.

كيف تتجنب النماذج اللغوية الكبيرة فخاخ المعلومات الخاطئة؟

دائماً كانت المعلومات الخاطئة وصعوبة التحقق منها تحدياً مرتبطاً بانتشار الإنترنت وسهولة النشر من خلالها من قِبل كل المستخدمين، وتعاظم هذا التحدي بظهور النماذج اللغوية الكبيرة، إذ يمكن أن تُستخدم لنشر الأخبار المزيفة، غير أن ورقة بحثية بعنوان “إثبات الحقائق في الادعاءات المعقدة باستخدام الاستدلال الذي توجهه البرامج” شارك فيها البروفيسور ناكوف ومجموعة من الباحثين، أثبتت أن النماذج اللغوية نفسها يمكن تسخيرها للتحقق من صحة المعلومات.

حيث طوّر المؤلفون نظاماً يُدعى برنامج إف سي (ProgramFC)، يأخذ الادعاءات المعقدة، ويُقسّمها إلى الأجزاء المكونة لها أو بياناتها، ويتحقق منها بهدف إصدار حكم إن كان الادعاء صحيحاً أو خاطئاً مع توضيح أسباب الحكم. ويتكون البرنامج من ثلاثة عناصر أساسية: الإجابة عن الأسئلة البسيطة، والتحقق من صحة الادعاءات البسيطة، وحل التعبيرات المنطقية.

ففي الورقة، حلّل المؤلفون الادعاء الآتي: “وُلِد جيمس كاميرون ومخرج فيلم بين النجوم (Interstellar) في البلد نفسه”. يقول ناكوف: “إذا بحثت عن هذا الادعاء، فلن تتمكن حقاً من العثور على إجابة مباشرة له على الإنترنت”.

ويستطرد: “ولكن يقوم ProgramFC بتقسيم الادعاء المركب إلى أسئلة بسيطة، مثل أين ولِد جيمس كاميرون؟ في كندا، ثم من هو مخرج فيلم Interstellar؟ كريستوفر نولان، ثم أين ولِد كريستوفر نولان؟ في المملكة المتحدة. والآن هل المملكة المتحدة هي كندا نفسها؟ الإجابة هي لا. إذاً، هذا الادعاء غير صحيح. ما حدث هنا هو أنك تأخذ مطالبة معقدة وتقوم بتحليلها إلى الخطوات التي يجب أن تحدث حتى تتمكن من التحقق من صحتها”.

ولكن، لن يحتاج كل ادعاء إلى التحقق، فهناك عدة جمل تكون عبارة عن آراء، بحسب ناكوف، فعندما تقول إن أفضل لون غطاء سيارة في أبوظبي هو اللون الأبيض، أو أن أفضل بنك هو هذا أو أفضل مدرسة هي تلك، فهذه آراء وليست بالضرورة ادعاءات واقعية.

وهنا يمكن اتباع آلية بسيطة مثل تظليل الجزء الذي تم التحقق منه تماماً بالأخضر على سبيل المثال، والجزء الذي تم التحقق من صحته نوعاً ما باللون الأحمر، بينما يعني اللون الأصفر أن النظام لم يتمكن من التحقق منه أو أنه ليس من المثير للاهتمام التحقق من الحقائق المتعلقة به.

ثلاثة نماذج لغوية تغيّر قواعد اللعبة

تسعى جامعة محمد بن زايد للذكاء الاصطناعي إلى الوصول بالنماذج اللغوية إلى مستويات مختلفة من ناحية التكلفة والتأثير البيئي وحجم بيانات التدريب، ونستعرض هنا ثلاثة نماذج لغوية مختلفة طوّرتها الجامعة أو تعاونت مع مؤسسات أخرى لتطويرها.

جيس: نموذج اللغة العربية الكبير المفتوح المصدر الأعلى جودة في العالم

خرج العديد من النماذج اللغوية العالمية المفتوحة المصدر إلى النور، لكن المستخدِم العربي لا يزال يجد صعوبة في إيجاد نموذج لغوي عربي يضاهي هذه النماذج بسبب ضعف المحتوى العربي على الإنترنت بطبيعة الحال. وهنا يأتي دور جيس (Jais) الذي أطلقته جامعة محمد بن زايد للذكاء الاصطناعي بالتعاون مع إنسِبشن (Inception)، التابعة لمجموعة جي 42 (G42) وشركة سيريبراس سيستمز، والذي دُرِّب باستخدام حاسوب فائق مدعوم بالذكاء الاصطناعي يُسمَّى كوندور غالاكسي (Condor Galaxy)، يتمتع بقدرة حوسبة متعددة، إكسافلوبس (مليون تريليون عملية حسابية في الثانية)، ليقدّم النموذج خدماته إلى أكثر من 400 مليون شخص.

فيقول ناكوف، إن جيس هو نموذج اللغة العربية الكبير المفتوح المصدر الأكثر دقة في العالم، دُرِّب على 395 مليار رمز مميز (tokens) بينها 116 مليار رمز عربي و279 مليار رمز إنجليزي، ما يجعله في الأساس نموذجاً ثنائي اللغة، موضحاً أن جيس يتفوق على النماذج العربية الحالية بفارق كبير، وينافس النماذج الإنجليزية ذات الحجم المماثل على الرغم من تدريبه على بيانات أقل بكثير.

النتيجة المثيرة التي توصل إليها فريق تطوير نموذج جيس أن المكون الإنجليزي للنموذج تعلّم من البيانات العربية، والعكس؛ أي أنه قدّم حلاً لقلة المحتوى العربي الموجود على الإنترنت، إذ استفاد النموذج من البيانات باللغة الإنجليزية، ما فتح حقبة جديدة من التطوير والتدريب في النماذج اللغوية الكبيرة.

فيكونا: نموذج لغوي مستدام متاح للجميع

على الرغم من الأهمية المتزايدة للنماذج اللغوية، فإن تكلفة بنائها وصيانتها عملية غير مستدامة مالياً وبيئياً، إذ تصل تكاليف الحوسبة إلى عشرات الملايين من الدولارات سنوياً، ولها بصمة كربونية مماثلة لتلك التي تنتجها مدينة صغيرة.

عمل فريقٌ من الباحثين في جامعة محمد بن زايد للذكاء الاصطناعي، وجامعة كاليفورنيا في بيركلي، وجامعة كارنيغي ميلون، وجامعة ستانفورد، وجامعة كاليفورنيا في سان دييغو، لمعالجة التكاليف غير المستدامة لروبوتات الدردشة من خلال إنشاء نموذج فيكونا (Vicuna)، وهو نموذج لغوي مفتوح المصدر يكلف تدريبه 300 دولار أميركي وله بصمة كربونية منخفضة جداً، مقارنة بتشات جي بي تي، الذي كلّف تدريبه أكثر من أربعة ملايين دولار مع ما يُقدّر بنحو 500 طن من الكربون المنبعث.

ومع نسبة الحجم إلى الطاقة الضئيلة، يمكن استيعاب فيكونا بسهولة في مسرّع (GPU) واحد، مقارنة بعدة مئات من المليارات إلى أكثر من تريليون معلمة لتشات جي بي تي. لذلك، ليس من المستغرب أن سهولة الوصول إلى فيكونا جعلته حديث الساعة بين عشية وضحاها، إذ حصل عبر موقع الويب المفتوح المصدر غيت هاب (Github) على أكثر من 12,000 نجمة في أسبوعين فقط، في الوقت الذي استغرق نموذج ستيبل ديفيوجن (Stable Diffusion) شهراً للوصول إلى 50,000 نجمة.

المثير في فيكونا أنه يدحض نظرية شركة أوبن أيه أي (Open AI) التي تروّج إلى أن المزيد من المعلمات يقود إلى نتائج أفضل، بينما يثبت فيكونا أن الجودة لا تتعارض مع التكلفة القليلة والاستدامة المالية والاستدامة البيئية. فعلى الرغم من تكلفته القليلة، يتمتع فيكونا بقدرة تنافسية عالية مع تشات جي بي تي وبارد، إذ سجّل نحو 90% في تقييمات اللغة الذاتية، ما يجعله أقوى بديل معروف ومتاح للعامة.

لاميني: نسخة مصغرة بإمكانات النماذج الكبرى

طوّر الفريق البحثي في جامعة محمد بن زايد للذكاء الاصطناعي نموذجاً آخرَ باسم لاميني (LaMini-LM)، من خلال استخلاص المعرفة من تشات جي بي تي على غرار الطريقة التي ينقل بها المعلم نسخة مكثّفة من معرفته إلى الآخرين. إذ طرح الباحثون أسئلة على تشات جي بي تي، وحصلوا على إجابات، واستخدموا تلك الإجابات لتدريب نموذج لاميني. وعلى الرغم من أن التدريب استغرق وقتاً أقل بكثير، فإن أداء نماذج لاميني كان مثل نظيراتها الأكبر حجماً تقريباً.

ويقترح الفريق البحثي بالجامعة أنه بدلاً من ترك القوى العاملة لديك لاستخدام النماذج المستندة إلى السحابة للإجابة عن الأسئلة وإنتاج المحتوى، يمكن تخصيص حل مثل لاميني ليناسب حالة الاستخدام الخاصة بك، مع المساعدة في الحفاظ على بياناتك آمنة.

ويقول ناكوف إنه في حين كان فيكونا نتيجة لتعاون الجامعة مع مؤسسات أخرى مختلفة. فقد أُنجز لاميني بالكامل هنا في الجامعة دون شركاء خارجيين، ما يدعم الفكرة الرئيسية وهي إمكانية الخروج بنموذج لغوي بموارد محدودة سواء من ناحية الأموال أو الأجهزة.

تسعى جامعة محمد بن زايد للذكاء الاصطناعي إلى تسخير خبراتها في النماذج التأسيسية والنماذج اللغوية الكبيرة إلى توجيه العديد من المؤسسات والشركات التابعة لحكومة أبوظبي في قطاعات متعددة من الصناعات، بما في ذلك الصحة والتعليم والتمويل والمناخ.