10 نصائح من سدايا لتحقيق أعظم استفادة من النماذج اللغوية الكبيرة

ملخص: أصبحت النماذج اللغوية الكبير جزءاً من حياتنا الرقمية، ووفقاً لغارتنر، بحلول 2026، يُرجّح أن يشارك الذكاء الاصطناعي التوليدي في أتمتة 60% من جهود التصميم لمواقع الويب الجديدة وتطبيقات الأجهزة المحمولة، ويستخدم أكثر من 100 مليون إنسان زملاء آليين للمساهمة في عملهم. وقد أصدرت الهيئة السعودية للبيانات والذكاء الاصطناعي "سدايا"، تقريراً عن الذكاء الاصطناعي التوليدي والنماذج اللغوية الكبيرة، وكيفية استخدامها، وأبرز التحديات والمخاطر المرتبطة بها، باعتبار الهيئة المرجع الوطني للذكاء الاصطناعي والبيانات وكل ما يتعلق بهما من تنظيم وتطوير وتعامل في المملكة، من هذا النماذج علام Allam، وتوصي بعددٍ من الخطوات للحصول على أكبر فائدة من النماذج اللغوية الكبيرة، ومنها أن تكون واضحاً ومحدداً وأن تعيّن شخصية للنموذج وتجرّب صيغاً مختلفة، وأن تستخدم الرموز للتحديد وتطلب بيانات مهيكلة.

يكمن سر الاهتمام العالمي بثورة الذكاء الاصطناعي الحالية في سرعة انتقال هذه التكنولوجيا من مختبرات الجامعات والشركات إلى ميادين التطبيق العملي والاستفادة الفعلية منها في مختلف القطاعات. ويمثّل الذكاء الاصطناعي التوليدي، والنماذج اللغوية الكبيرة تحديداً، رأس الحربة في هذه الثورة المستمرة. وقد دخلت السعودية سريعاً لتصبح جزءاً من هذه الثورة، ولا سيما بعد ابتكارها نموذجاً لغوياً عربياً يُدرج ضمن منصة واتسون إكس (Watsonx) في شركة آي بي إم (IBM)، لينضم إلى أفضل النماذج اللغوية العربية عالمياً وهو نموذج علام (Allam).

توغلت تطبيقات النماذج اللغوية الكبيرة في حياتنا اليومية خلال أشهر قليلة، وبدأنا استخدام بوتات الدردشة القائمة على هذه النماذج، مثل تشات جي بي تي (ChatGPT) وجيميناي (Gemini)، مساعداً شخصياً لكل شيء؛ بدءاً من إعداد قائمة المهام وجدولة المواعيد، والمساعدة على اتخاذ قرارات مثل التخطيط للسفر، وتلخيص الكتب، وحتى مساعدتك في العمل عبر كتابة رسائل البريد الإلكتروني، وتوليد الأفكار، واقتراح الخطط والاستراتيجيات، وحل المشكلات.

يزداد اعتماد الشركات والأفراد، على حد سواء، على النماذج اللغوية الكبيرة. فبحلول 2026، يُرجّح أن يشارك الذكاء الاصطناعي التوليدي في أتمتة 60% من جهود التصميم لمواقع الويب الجديدة وتطبيقات الأجهزة المحمولة، ويستخدم أكثر من 100 مليون إنسان زملاء آليين للمساهمة في عملهم، وفقاً لشركة غارتنر (Gartner).

ولكن لا تزال هناك بعض المعوقات التي تحول دون الخروج بأفضل المخرجات. وفي الحقيقة، وعلى الرغم من وجود تحديات كثيرة تتعلق باستخدام هذه النماذج كأي تكنولوجيا حديثة، فثمة بعض الطرق التي من شأنها دعم الخروج بنتائج أفضل، وكلمة السر هنا هي ما يُسمّى هندسة المدخلات أو هندسة الأوامر (Prompt Engineering). ولكن، قبل تقديم ممارسات هندسة الأوامر، من المهم أن نفهم كيفية عمل النماذج اللغوية الكبيرة، والتحديات التي تحول دون الحصول على المخرجات الدقيقة.

أصدرت الهيئة السعودية للبيانات والذكاء الاصطناعي "سدايا"، تقريراً عن الذكاء الاصطناعي التوليدي والنماذج اللغوية الكبيرة، وكيفية استخدامها، وأبرز التحديات والمخاطر المرتبطة بها، باعتبار الهيئة المرجع الوطني للذكاء الاصطناعي والبيانات وكل ما يتعلق بهما من تنظيم وتطوير وتعامل في المملكة، ولا سيّما أنها قد أطلقت في منتصف عام 2023م النسخة التجريبية من تطبيق علام (Allam)، أول تطبيق محادثة في المملكة العربية السعودية يُحادث المستخدمين ويرد على استفساراتهم باللغة العربية الفصحى والعامية ويصيغ الملخصات والاقتراحات في الكثير من الموضوعات المختلفة، والذي تم إدراجه مؤخراً ضمن منصة واتسون إكس (Watsonx) في شركة آي بي إم (IBM) بوصفه أحد أفضل النماذج التوليدية باللغة العربية.

ما هي النماذج اللغوية الكبيرة وكيف تعمل؟ وما هو تطبيق علام؟

النماذج اللغوية الكبيرة هي نوع من نماذج التعلم العميق المتقدمة يمكن تدريبها على فهم ومعالجة اللغات البشرية وتوليدها بطريقة شبيهة بالبشر. بكلمات أخرى، هي خوارزميات تعلم عميق يمكنها التعرف إلى المحتوى وتلخيصه والتنبؤ به وتوليده باستخدام مجموعات بيانات ضخمة للغاية. قد تحتوي النماذج اللغوية الشهيرة على مئات المليارات من المعاملات الوسيطة، وقد تصل إلى أكثر من تريليون معامل. ومن أشهر هذه النماذج جي بي تي-4 (GPT-4) الذي طوّرته شركة "أوبن أيه آي" (Open AI)، وبالم (PaLM) الذي طوّرته شركة جوجل، ولاما (LLaMA) الذي طوّرته شركة ميتا.

تُدرّب هذه النماذج على مجموعات البيانات الضخمة التي تضم مئات الملايين إلى مليارات الكلمات، وتعتمد على خوارزميات معقدة تغربل مجموعات البيانات الكبيرة وتتعرف إلى الأنماط على مستوى الكلمة.

وتتميز النماذج اللغوية الكبيرة بقدرتها على القيام بعدة مهام متنوعة لا تقتصر على كتابة النصوص وتلخيص الكتب والمقالات فقط، بل تشمل أيضاً الترجمة من لغة إلى أخرى والإجابة عن الأسئلة وتحليل المشاعر وكتابة الأكواد البرمجية وغيرها.

تطبيق علام: أول نموذج سعودي باللغة العربية يدرج ضمن أفضل النماذج اللغوية العربية عالمياً

أطلقت سدايا تطبيق "علاّم" كأول تطبيق محادثة في المملكة العربية السعودية، إذ يرد على استفسارات الجمهور في عددٍ من المجالات المعرفية باللغة العربية، كما يدعم الملايين من المقالات العربية والإنجليزية، ويستند إلى أقوى المراجع العربية في السعودية والعالم العربي.

ويقدّم علّام المعلومات في تخصصات متعددة مثل: الصحة، والرياضة، والتاريخ السعودي، والتعليم، ولا تقتصر مهامه على الدردشة والمحادثة النصية والصوتية فقط، وإنما تمتد إلى تحسين الصور القديمة وتلوينها، وتلخيص الوثائق، وغيرها من المهام. إذ خضعت النسخة الحالية منه للتدريب على مجموعة بيانات باللغة العربية ضمن أكبر مجموعات بيانات عالمياً، بالإضافة إلى محتوى متنوع باللغة الإنجليزية، كما خضعت لاختبارات صارمة ومعايير دقيقة لتجهيز بنيته التقنية والتدريبية ليكون مؤهلاً لمنافسة النماذج التوليدية الأخرى.

وبسبب هذه القدرات التقنية والاختبارات الدقيقة والتدريبات المتنوعة، تم اختيار نموذج "علّام" في مرحلته التجريبية ليُدرج ضمن منصة واتسون إكس في شركة آي بي إم، بعد مطابقته للمعايير العالمية في الذكاء الاصطناعي التوليدي في منصة واتسون إكس التي يتعامل معها المطورون في العالم باعتبارها أهم المنصات العالمية، ليكون ضمن أفضل النماذج اللغوية العربية عالمياً.

مخاطر النماذج اللغوية الكبيرة

هناك العديد من المخاطر والتحديات المرتبطة باستخدام النماذج اللغوية الكبيرة، والتي تؤثّر في ثقة المستخدمين بها، والخبر السار أن بعضها يمكن التغلب عليه ببعض الممارسات التي سنتطرق إليها، وهذه أبرز المخاطر:

مخاطر أمنية

تعتمد النماذج اللغوية على تلقي المعلومات من المستخدمين، ثم البحث عن الإجابات عبر الإنترنت، غير أن هذه الآلية تحمل في طياتها عدداً من المخاطر الأمنية، مثل تسريب المعلومات الخاصة بالمستخدمين، ومساعدة المجرمين على تصيّد معلومات المستخدمين، وإرسال الرسائل المزعجة إليهم، والنصب عليهم.

فمثلاً، أعلنت شركة أوبن أيه آي تسرب بيانات شخصية لـ 1.2% من المشتركين في تشات جي بي تي بلس (ChatGPT Plus)، تضمنت هذه البيانات الاسم والبريد الإلكتروني، ومعلومات الدفع.

المخاطر الأمنية لا تتوقف فقط على تسريب البيانات، وإنما توجيه المستخدمين إلى أشياء غير قانونية. فقد تمكّن العديد من الأشخاص من دفع نموذج الذكاء الاصطناعي إلى دعم العنصرية أو نظريات المؤامرة، أو تقديم اقتراحات إلى المستخدمين للقيام بأشياء غير قانونية، مثل سرقة المحلات التجارية أو صنع المتفجرات.

التحيز

من المخاوف التي تحيط بالنماذج هي أن تخرج الإجابات بناءً على بعض التحيزات. فعلى سبيل المثال، رصدت دراسة بعنوان "النماذج اللغوية الكبيرة تربط الإسلام بالعنف" تحيزات في نموذج تشات جي بي تي 3 (GPT-3) ضد الديانة الإسلامية، فعندما يُطلب من النموذج إدخالات تحتوي على كلمات "الإسلام" أو "المسلم" أو "الشرق الأوسط"، يولِّد تشات جي بي تي 3 نصوصاً نمطية، إذ إن 66% من استجابات تشات جي بي تي 3 للمدخلات التي تضم مسلمين تضمنت إشارات إلى العنف.

وقد رصد بحث آخر من جامعات واشنطن، كارنيغي ميلون، شيان جياوتونغ، احتواء نماذج الذكاء الاصطناعي اللغوية على تحيزات سياسية مختلفة، بعد سؤالها حول مواقفها إزاء موضوعات مثل الحركة النسوية والديمقراطية. فكانت نماذج تشات جي بي تي (ChatGPT) وجي بي تي 4 (GPT4) من أوبن أيه آي الأكثر ميلاً نحو اليسار المتحرر، بينما كان لاما (LLaMa) من ميتا (Meta) الأكثر ميلاً نحو اليمين المتسلط.

ولحسن الحظ، فإن النماذج اللغوية قد تنتج محتوى غير متحيز بمجرد الطلب منها، ففي تجربة، وجد الفريق أن مجرد توجيه تعليمة نصية إلى النموذج كي يحرص على عدم وجود قوالب نمطية في إجاباته أدّى إلى أثر إيجابي كبير في النتائج التي يقدّمها.

المعلومات الخاطئة: هلوسة الذكاء الاصطناعي

إحدى المشكلات التي تواجه استخدام النماذج اللغوية الكبيرة هي توليد المعلومات الخاطئة أو ما يُعرف بهلوسة الذكاء الاصطناعي والتي تقود إلى توليد مخرجات قد تبدو معقولة، لكنها إما غير صحيحة من الناحية الواقعية وإما لا علاقة لها بالسياق المحدد. ويمكن أن تتخذ هلوسات الذكاء الاصطناعي أشكالاً مختلفة، مثل إنشاء تقارير إخبارية كاذبة إلى اختلاق معلومات عن أشخاص أو أحداث تاريخية أو حقائق علمية. فقد قاس باحثون من جامعة أوكسفورد وشركة أوبن أيه آي مدى صواب إجابات هذه النماذج، وتبين أن نسبة صواب أفضل نموذج كانت 58% في الوقت الذي وصلت فيه نسبة الصواب في الأداء البشري إلى 94%.

كيف تحصل على أدق المخرجات من النموذج اللغوي الكبير؟

إذا قررت استخدام النماذج اللغوية الكبيرة والاعتماد عليها في اتخاذ قرارات مهمة، فربما تحتاج إلى ضمان الخروج بأفضل نتائج ممكنة، وهذا ما توفره هندسة الأوامر (Prompt Engineering)، وهي مهارة تصميم طلبات فعّالة إلى النموذج اللغوي لإنتاج أفضل مخرجات ممكنة لطلبك.

ورصد التقرير الذي أصدرته سدايا أفضل الممارسات والنصائح لصياغة طلبات فعّالة ستساعدك على تحقيق أقصى استفادة من النموذج اللغوي، وتوفّر عليك الوقت والمال، خاصة إذا كنت تستخدم خدمة مدفوعة أو مقيدة بعدد من المحاولات.

1. كُنْ واضحاً ومحدداً

عند صياغة طلباتك إلى النموذج، فإن الوضوح والتخصيص هما الركنان الأساسيان للخروج بنتيجة دقيقة. لذا، كُنْ محدداً ومفصلاً قدر الإمكان حول المهمة المطلوبة، وتجنّب اللغة الغامضة، وحاول أن توفّر سياقاً كافياً لمساعدة النموذج على فهم طلبك.

1. مثال أقل فاعلية: أخبرني عن النماذج اللغوية الكبيرة.

مثال أكثر فاعلية: اشرح لي المبادئ الأساسية التي تعمل وفقاً لها النماذج اللغوية الكبيرة، وتطبيقاتها في مجال خدمة العملاء.

2. مثال أقل فاعلية: أرسل بريداً إلى شركة التأمين لسؤالها عن التعويضات.

مثال أكثر فاعلية: أنا عميل لدى شركة التأمين س منذ عام 2022، وتعرضت سيارتي لحادث أمس الأول، اكتب رسالة بريدية لشرح الموقف، ومعرفة الإجراءات التي يتعيّن عليّ القيام بها للحصول على تعويض.

2. عيّن شخصية للنموذج

أكدت سدايا، في تقريرها، أهمية إعطاء النموذج دوراً مخصصاً لمهمة معينة للخروج بالنتيجة التي يتوقعها المستخدم.

1. مثال أقل فاعلية: ترجم القطعة التالية إلى الإنجليزية: "..".

مثال أكثر فاعلية: أنت مترجم من اللغة اليابانية إلى الإنجليزية، ترجم هذه القطعة "..".

2. مثال أقل فاعلية: اكتب مقالاً عن الذكاء الاصطناعي التوليدي والتوقعات المستقبلية له.

مثال أكثر فاعلية: أنت باحث خبير في الذكاء الاصطناعي لديك القدرة على جمع البيانات والمعلومات وتحليلها، اكتب مقالاً عن الذكاء الاصطناعي التوليدي والتوقعات المستقبلية له.

3. جرّب صيّغاً مختلفة

يمكن أن تؤدي الصيّغ المختلفة، وفقاً لأوبن أيه أي، إلى نتائج مختلفة. لذا، يمكنك تجربة صيغ مختلفة، مثل: صيغة استفهام أو تقرير أو أمر، للعثور على التنسيق الذي يناسب حالة الاستخدام المحددة الخاصة بك.

مثال 1: ما هي فوائد السيارات الكهربائية بالنسبة للبيئة؟

ناقش مزايا السيارات الكهربائية بالنسبة للبيئة.

اذكر أهم خمس فوائد للطاقة الشمسية للبيئة.

مثال 2: كيف يسهم الذكاء الاصطناعي في قطاع العقارات؟

وصف دور الذكاء الاصطناعي في نمو قطاع العقارات.

قدّم ثلاثة أمثلة لتعزيز الذكاء الاصطناعي قطاع العقارات.

4. استخدم الرموز للتحديد

سيساعدك استخدام رموز لتحديد أجزاء من النص المدخل بهدف توفير إرشادات واضحة وإنشاء حدود واضحة بين نص معين والمدخلات المتبقية، ويمكن أن تكون الرموز فاصلة "،"، أو أقواساً ""، أو شرطة "-"، أو غيرها.

مثال 1 أقل فاعلية: لخصّ النص أدناه كقائمة نقطية بأهم النقاط: …
مثال أكثر فاعلية: لخص النص أدناه كقائمة نقطية بأهم النقاط: "…"
مثال 2: أنت مترجم خبير من اللغة الإنجليزية إلى اللغة العربية، ترجم النص التالي إلى اللغة العربية: " عندما.."

5. اطلب مخرجات مهيكلة

يمكنك التحكم في شكل استجابة النموذج، من خلال تحديد تنسيق الإخراج المطلوب، إذ إن تحديد صيغة المخرجات للنموذج يحسن نتائج النموذج ويقدّمها بصيغة مناسبة.

مثال 1: اقترح أفضل خمسة مطاعم قريبة من برج إيفل في باريس تقدّم خيارات الطعام النباتي. يجب أن تكون إجابتك بتنسيق جسون JSON.
مثال 2: قدّم لي قائمة بخمسة كتب للتطوير الذاتي بلغة التوصيف القابلة للتوسعة XML.
مثال 3: اكتب مقارنة بين منتج أ ومنتج ب في جدول.

6. تقديم أمثلة ناجحة

يساعد تقديم أمثلة ناجحة قريبة مما يريده المستخدم في تحسين المخرجات وتوجيه النموذج إلى النتيجة المطلوبة. وتكون هذه الممارسة مفيدة، وفقاً لسدايا، حينما يكون الطلب محاكياً لنمط معين من الإجابات قد يصعب التعبير عنها مباشرة. بكلمات أخرى، عندما يكون المطلوب هو مفهوم مجرد مثل الإبداع أو التفاؤل، فإن تقديم أمثلة محددة للنموذج يمكنه من محاكاة الأسلوب لتوليد النتيجة المرجوة.

مثال 1: اكتب عبارة ملهمة عن الأمل والتفاؤل مشابهة للنص الآتي: "عش حياتك كل يوم كما لو كنت ستصعد جبلاً، وانظر بين الفينة والأخرى إلى القمة حتى لا تنسى هدفك، ولكن دون إضاعة الفرصة لرؤية المناظر الرائعة في كل مرحلة".
مثال 2: اكتب عبارة إعلانية تجذب الجمهور مشابهة للنص التالي: "إن ما نقدمه ليس مجرد منتج، بل يوفّر لك أسلوب حياة جديدة، تطور فيها نفسك وترتقي بإمكاناتك".

7. حدد الخطوات المطلوبة

في الطلبات المتشعبة والمعقدة، يفضَّل تحديد الخطوات المطلوبة بالترتيب، لتعزيز موثوقية مخرجات النموذج بشكل دقيق ومنظم، واختصار الكثير من الوقت والمجهود.

مثال:

حلل التغريدات الآتية "..".

ضع التصنيف في جدول.

صنّف كل تغريدة على أنها إيجابية أو سلبية.

وضّح نسبة التغريدات الإيجابية والسلبية.

8. التحكم في طول المخرجات

للتحكم في طول استجابة النموذج، يمكنك إما تعيين حد لعدد الأحرف أو طلب طول محدد بشكل صريح في الطلب الخاص بك.

مثال 1: ضع الميزات الرئيسية لهاتفنا الذكي الجديد في رسالة بطول تغريدة.
مثال 2: لخّص النقاط الرئيسية للمقالة في ثلاث جمل.

9. استخدم مراجع محددة

هناك آلاف المصادر التي يستقي منها النموذج إجاباته، وهو ما قد يتسبب في الهلوسة التي ذكرناها سابقاً، لذلك، يمكنك تحديد مصادر بعينها وتوجيه النموذج إلى استخدامها، إضافة إلى أنها تعزز الشفافية والمساءلة، خاصة إذا أراد المستخدم إسناد المعلومات إلى مصادرها.

مثال: استخدم الملفات المرفقة للإجابة عن السؤال الآتي: "...".

10. تحقق من المخرجات

لتقليل الأخطاء في إجابة النموذج، يمكنك الطلب من النموذج مراجعة مخرجاته لضمان جودتها ودقتها، خاصة إذا كانت معقدة، ويمكنك توجيهه بإرشادات مثل البُعد عن التحيّز على سبيل المثال.

مثال: هل نسيت أي تفاصيل مهمة في إجاباتك السابقة؟

النماذج اللغوية الكبيرة متعددة الوسائط

لا تنفك النماذج اللغوية ذاتها في التطوّر يوماً بعد يوم، إذ ظهرت الآن النماذج اللغوية الكبيرة المتعددة الوسائط (Multi-Modality LLM)، والتي ليست قادرة فقط على فهم النصوص وتوليدها، بل قادرة أيضاً على ربط المعلومات النصية بالبيانات المرئية والسمعية، وبالتالي توليد تفاعلات أكثر طبيعية بين الإنسان والحاسوب. فمثلاً، في بيئة الرعاية الصحية، يمكن لهذه النماذج تحليل الصور الطبية جنباً إلى جنب مع سجلات المرضى لتقديم رؤى تشخيصية مفصلة. وفي مجال التعليم، يمكن لهذه النماذج إنشاء تجارب تعليمية أكثر جاذبية وتفاعلية من خلال دمج النصوص والصور والأصوات.

وفي مجال الترفيه يمكن لهذه النماذج إنشاء بيئات افتراضية غامرة وتجارب رواية قصص تفاعلية تمزج بين العناصر المرئية والسمعية والنصية، وحتى بالنسبة لمجال مثل خدمة العملاء، يمكن للنماذج متعددة الوسائط تحسين تفاعلات روبوتات المحادثة (Chatbot) من خلال فهم استفسارات العملاء والرد عليها من خلال النص والصوت، ما يوفر تجربة أكثر سلاسة وطبيعية. بالإضافة إلى ذلك، يمكن لهذه النماذج أن تساعد على سد فجوات التواصل للأفراد ذوي الهمم عن طريق تحويل الكلام إلى نص، والنص إلى كلام، وحتى توليد لغة الإشارة من الكلمات المنطوقة. مع استمرار تطور هذه النماذج، فإن قدراتها على معالجة أنواع متنوعة من المعلومات ستدفع الابتكار وتخلق فرصاً جديدة عبر مختلف القطاعات.

وقد أطلقت سدايا بالتعاون مع جامعة الملك عبدالله للعلوم والتقنية "كاوست" ابتكارها الجديد: MiniGPT-Med، وهو نموذج لغوي كبير متعدد الوسائط، يساعد الأطباء على تشخيص الأشعة الطبية، إذ يمكن للنموذج بمجرد إدخال صورة طبية له إصدار التقارير الطبية، والاجابة عن الاسئلة البصرية الطبية، والتحديد الوصفي للأمراض، واكتشاف موقع المرض وتشخيصه، وقد تم تدريب النموذج على صور طبية مختلفة مثل الأشعة السينية والأشعة المقطعية والرنين المغناطيسي، وقد أظهر تفوقاً ملحوظاً خلال التجارب.

لم يعد هناك مجال للنقاش بأن الاعتماد على النماذج اللغوية الكبيرة سيتزايد بشكلٍ مطّرد إلى أن يصبح جزءاً من يومنا جميعاً كما حدث مع التقنيات السابقة التي أخذنا وقتاً حتى أصبح التعامل معها أكثر سلاسة وفعالية، وهذا هو الحال نفسه مع النماذج اللغوية، فمع المزيد من الأبحاث والإفصاحات التي تمنحنا مفاتيح التعامل معها، سيصبح الأمر سلساً قريباً.