أصبح بوت الدردشة تشات جي بي تي (ChatGPT) المدعوم بالذكاء الاصطناعي منذ إصداره في نهاية شهر نوفمبر/ تشرين الثاني من عام 2022 موضوعاً ساخناً عبر الإنترنت، حيث اجتذب ملايين المستخدمين في غضون بضعة أشهر فقط، وذلك لقدرته الفائقة في فهم وإنشاء لغة طبيعية شبيهة بالبشر بدقة وطلاقة غير مسبوقة، حيث يعتبر أكبر وأقوى نموذج لغوي تم إنشاؤه على الإطلاق.
كيف يعمل بوت الدردشة تشات جي بي تي؟
بوت تشات جي بي تي هو عبارة عن أحدث النماذج اللغوية الكبيرة في الوقت الحالي، تم تطويره بواسطة شركة أوبن أيه آي (OpenAI) باستخدام نموذج اللغة جي بي تي (GPT). يمكنه الإجابة عن أسئلتك وكتابة رسائل البريد الإلكتروني وإجراء محادثة وشرح التعليمات البرمجية، كل ذلك استناداً إلى معالجة اللغة الطبيعية.
ويعمل بوت الدردشة تشات جي بي تي من خلال التدريب المسبق على نموذج الشبكات العصبونية العميقة التي تعمل على مجموعة بيانات ضخمة من النص ثم ضبطها في مهام محددة، مثل الإجابة عن الأسئلة أو إنشاء نص، وتتكون الشبكة من سلسلة من الطبقات المترابطة أو ما يسمى المحولات (Transformer) التي تعالج نص الإدخال وتولّد تنبؤاً بالمخرجات.
اقرأ أيضاً: كيف تسعى أوبن أيه آي إلى جعل تشات جي بي تي أكثر أماناً وأقل تحيزاً؟
وقد تم تدريب النموذج على مجموعة بيانات ضخمة لتكوين شبكة عصبونية عميقة على غرار الدماغ البشري، والتي سمحت للنموذج بتعلم الأنماط والعلاقات في البيانات النصية للتنبؤ بالنص الذي يجب أن يأتي بعد أي استفسار معين، ويعمل النموذج من خلال محاولة فهم الاستفسار الذي تقدمه ثم نطق سلاسل من الكلمات التي يتوقع أنها ستجيب عن الاستفسار بشكلٍ أفضل بناء على البيانات التي تم تدريبه عليها.
مع ملاحظة أن بوت الدردشة تشات جي بي تي لا يعمل على مستوى الجملة، بدلاً من ذلك يقوم بإنشاء نص لما يمكن أن يتبعها من الكلمات والجمل وحتى الفقرات أو المقاطع، وهذا يعني أنه ليس النص التنبؤي على هاتفك الذي يخمن الكلمة التالية بصراحة، بل يحاول إنشاء استجابات متماسكة تماماً لأي استفسار.
ولتحسين قدرته على الاستجابة لمجموعة متنوعة من المطالبات المختلفة، تم تحسينه للحوار باستخدام تقنية تسمى التعلم المعزز من التقييمات البشرية (RLHF)، والتي تعمل بشكلٍ أساسي من خلال تصنيف استجابات نموذجية أو أكثر من قِبل مدربي الذكاء الاصطناعي، بحيث يمكن للذكاء الاصطناعي معرفة الاستجابة الأفضل.
اقرأ أيضاً: ما هو «جي بي تي-4»؟ ولماذا قد يمثل علامة فارقة في تاريخ الذكاء الاصطناعي؟
وتتمثل إحدى الميزات الرئيسية لبوت الدردشة تشات جي بي تي في قدرته على فهم سياق المحادثة وإنشاء الاستجابات المناسبة، وقد أصبح هذا ممكناً من خلال استخدام آليات الانتباه الذاتي (Self-Attention) والتي تسمح للشبكة بموازنة أهمية الكلمات والعبارات المختلفة في نص الإدخال بناء على صلتها بالمهمة قيد البحث.
وميزة رئيسية أخرى لتشات جي بي تي هي قدرته على إنشاء نص متماسك حتى عند إعطاء كلمات قليلة فقط كمدخلات، وقد أصبح هذا ممكناً من خلال استخدام المحولات التي يمكنها نمذجة التبعيات بعيدة المدى في نص الإدخال وإنشاء تسلسلات متماسكة من الكلمات.
ما هي قوة المعالجة التي يعمل عليها تشات جي بي تي؟
تم تدريب نموذج تشات جي بي تي باستخدام البنية التحتية للحوسبة الفائقة لشركة مايكروسوفت آزور (Azure) مع وحدات معالجة الرسومات من شركة إنفيديا (Nvidia)، وتشتمل قوة المعالجة على أكثر من 285 ألف نواة لوحدة المعالجة المركزية و10 آلاف وحدة معالجة رسومات واتصال بالشبكة بسرعة 400 غيغا بايت في الثانية لكل خادم معالجة.
وبحسب الخبراء، فإنه حتى لو تمكنت الشركة من ملاءمة النموذج في وحدة معالجة رسومات واحدة، فإن العدد الكبير من عمليات الحوسبة المطلوبة يمكن أن يؤدي إلى أوقات تدريب طويلة بشكلٍ غير واقعي، وفي حالة النموذج اللغوي الكبير جي بي تي، فقد تستغرق ما يُقدّر بـ 288 عاماً على وحدة معالجة رسومات واحدة من نوع إنفيديا في 100 (V100 Nvidia).
اقرأ أيضاً: ما دور القوى العاملة البشرية في طفرة الذكاء الاصطناعي؟
وبحسب أستاذ علوم الكمبيوتر في كلية لندن الجامعية (University College London)، ميركو موسوليسي (Mirco Musolesi): فإن تطوير نماذج لغوية كبيرة بشكلٍ أكبر سيتطلب برامج محسّنة وبنية تحتية أفضل، ويعتقد أن الجمع بين الاثنين، بالإضافة إلى الأجهزة التي لم يتم تطويرها بعد، سيُنهي حالة الاختناق التي شهدناها عند إصدار نموذج تشات جي بي تي 3 (ChatGPT-3)".
ويضيف: "أجهزة الكمبيوتر العملاقة الجديدة التي تعمل بالذكاء الاصطناعي، مثل تلك التي يتم تطويرها بواسطة شركة ميتا ومايكروسوفت وإنفيديا قد تحل بعض هذه المشكلات، لكن هذا ليس سوى جانب واحد من المشكلة، نظراً لأن النماذج لا تتناسب مع وحدة حوسبة واحدة، فهناك حاجة إلى بناء معماريات متوازية تدعم هذا النوع من العمليات المتخصصة بطريقة موزعة ومتسامحة مع الأخطاء، وسيأتي هذا بتكلفة باهظة، وللوصول إلى سرعة (ميلي ثانية) يمكن لمحرك البحث فيها أن يقدّم آلاف النتائج، ستتطلب أجهزة وبرامج الذكاء الاصطناعي استثمارات إضافية كبيرة".
اقرأ أيضاً: هل ستحل بوتات الدردشة مكان محركات البحث والموسوعات؟
ما مقدار الطاقة التي يستخدمها تشات جي بي تي؟
بحسب العديد من الخبراء، فإن تدريب النماذج اللغوية الكبيرة يتطلب قدراً هائلاً من القوة الحاسوبية، والتي لا تتوفر سوى لدى شركات التكنولوجيا الكبرى. فعلى الرغم من أن شركة أوبن أيه آي المطورة لنموذج اللغة جي بي تي لم تفصح صراحةً عن مقدار الطاقة المستخدمة في تدريب النموذج، فإن التحليلات التي أجراها باحثون مستقلون قدّرت أن تدريب النموذج يستهلك ما يصل إلى 1,287 ميغا واط في الساعة من الكهرباء، ما أدّى إلى انبعاثات كربونية وصلت إلى نحو 550 طناً من ثاني أوكسيد الكربون.
مع ملاحظة أن هناك فرقاً كبيراً بين استخدام بوت الدردشة تشات جي بي تي كمنتج مستقل والذي يصل مستخدموه إلى 13 مليون مستخدم يومياً، وبين دمجه في محرك البحث بينغ التابع لشركة مايكروسوفت، والذي يعالج نحو نصف مليار عملية بحث يومياً.
اقرأ أيضاً: بوت تشات جي بي تي مبدع وسهل الاستخدام لكن مخاطره كثيرة
بحسب الشريك المؤسس لشركة البيانات الكندية كيو سكيل (QScale)، مارتن بوشارد (Martin Bouchard)، وبناء على قراءته لخطط مايكروسوفت وجوجل في مجال البحث، فإن إضافة الذكاء الاصطناعي التوليدي إلى العملية سيتطلب حوسبة أكثر بأربع أو خمس مرات على الأقل لكل بحث كحد أدنى، ويشير إلى أن سبب توقف بوت الدردشة عن تقديم النتائج حتى عام 2021 هو محاولة من الشركة لتخفيض متطلبات الحوسبة.
ولكنه يستدرك قائلاً: "من أجل تلبية متطلبات مستخدمي محرك البحث، فإنهم مجبرون على تغيير ذلك، ومن ثم إذا كانوا سيعيدون تدريب النموذج بكثافة وإضافة المزيد من المعلمات التدريبية، فهذا مقياس مختلف تماماً وسيتطلب ذلك استثماراً كبيراً في الأجهزة، حيث لن تكون مراكز البيانات الحالية والبنية التحتية التي نمتلكها قادرة على التعامل مع سباق الذكاء الاصطناعي التوليدي".
اقرأ أيضاً: كيف تسمم النصوص التي يولدها الذكاء الاصطناعي الإنترنت؟
لماذا بوت الدردشة تشات جي بي تي لا يقدّم معلومات محدّثة؟
على عكس بوتات الدردشة التقليدية، فإن بوت الدردشة تشات جي بي تي غير متصل بالإنترنت ولا يمكنه الوصول إلى المعلومات المحدّثة المنشورة على الإنترنت، بدلاً من ذلك يعتمد على البيانات التي تم تدريبه عليها لتوليد الردود، وتتضمن هذه البيانات مجموعة كبيرة من النصوص من مصادر مختلفة، بما في ذلك الكتب والمقالات والمواقع الإلكترونية.
وأحد أسباب عدم اتصال بوت الدردشة تشات جي بي تي بالإنترنت هو أنه صُمم ليكون نظام معالجة لغة وليس محرك بحث، حيث إن الغرض الأساسي منه هو فهم وإنشاء نص يشبه الإنسان وليس البحث في الإنترنت عن المعلومات، ويتم تحقيق ذلك من خلال عملية تسمى التدريب المسبق حيث تتم تغذيته بكمية كبيرة من البيانات ثم ضبطه لأداء مهام محددة، مثل الترجمة أو التلخيص.
ومع ذلك، لا يزال قادراً على إنشاء ردود شبه نموذجية بناء على سياق المحادثة، وهذا يعود إلى تدريبه على مجموعة واسعة من النصوص وتعلم فهم العلاقات بين الكلمات والمفاهيم، ونتيجة لذلك يمكن أن يولّد ردوداً ذات صلة بالمحادثة وتبدو طبيعية للمستخدم.