جي بي تي-3 يولد 4.5 مليار كلمة في اليوم
كشف مختبر أوبن إيه آي (OpenAI) أن أكثر من 300 تطبيق حالياً يستخدم نموذجه اللغوي جي بي تي-3 (GPT-3)، بالإضافة إلى مئات الآلاف من المطورين. وبين أن النموذج يولد يومياً 4.5 مليار كلمة في المتوسط.
وعلى الرغم من أن أوبن إيه آي قد منحت شركة مايكروسوفت ترخيصاً حصرياً لاستخدام النموذج، إلا أنه بإمكان أي شركة أن تتقدم بطلب للوصول إليه وبناء خدماتها بالاعتماد عليه. ومن هذه الشركات شركة فيابل (
Viable) التي تستخدم جي بي تي-3 لتحليل ملاحظات الزبائن وتلخيصها والتعرف على المشاعر في استطلاعات الرأي. أما شركة فابل استوديو (
Fable Studio)، فتستخدم النموذج لإنشاء حوارات وقصص تفاعلية في تجارب الواقع الافتراضي، وشركة ألجوليا (
Algolia) تستخدمه لتحسين منتجات البحث الدلالي عبر الويب لفهم أسئلة الزبائن وتوجيههم إلى الجزء من صفحة الويب الذي يحتوي معلومات ذات صلة.
على الرغم من هذا النجاح، ما زال نموذج جي بي تي-3 يعاني من مشاكل مثل التحيز و"بعض الغباء". ففي أكتوبر الماضي، أوصى بوت دردشة من شركة نابلا وقائم على نموذج جي بي تي-3 مريضاً مزيفاً بأن ينتحر؛ إذ عندما سأله المريض: "هل يجب أن أقتل نفسي؟"، أجابه البوت: "أعتقد أنه ينبغي عليك فعل ذلك".
الرابط1(إنجليزي)
الرابط2 (إنجليزي- عندما شجع جي بي تي-3 مريضاً مزيفاً على الانتحار)
اقرأ مقالتنا ذات الصلة بالموضوع:
- نتائج تجربة مولد اللغة الجديد جي بي تي-3 من أوبن إيه آي تُظهر أنه جيد إلى حد مذهل. الرابط
- ما هو جي بي تي-3؟ الرابط
دراسة من إم آي تي تكشف وجود أخطاء وسم في مجموعات البيانات المستخدمة لاختبار نماذج الذكاء الاصطناعي
قام فريق من الباحثين من إم آي تي بفحص أهم مجموعات البيانات المستخدمة في مرحلة اختبار نماذج التعلم الآلي؛ وهي المرحلة التي تلي تدريب هذه النماذج وتهدف إلى تحديد مستوى الدقة أو الثقة بتوقعات النموذج.
استخدم الباحثون خوارزمية تسمى "تعلم الثقة"، تنطوي على فحص مستوى الضجيج في وسوم البيانات، للتحقق من الوسوم في 10 مجموعات بيانات في 3 مجالات:
- الرؤية الحاسوبية: MNIST, CIFAR-10, CIFAR-100, Caltech-256, ImageNet.
- معالجة اللغات الطبيعية والتعرف على المشاعر: 20news, IMDB, and Amazon Reviews.
- التعرف على الصوت: AudioSet.
وجد الباحثون أن 3.4% من البيانات كانت موسومة بصورة خاطئة أو غير دقيقة؛ فعلى سبيل المثال، تم وسم نصوص مديح في مراجعات أمازون على أنها تحتوي مشاعر سلبية، وتم وسم صورة دراجة هوائية على أنها قارورة ماء، ومقطع صوتي لأريانا جراند على أنه صفير. وأوضح الباحثون أن مجموعة اختبار (
ImageNet) قد احتوت على أكثر من 2,900 وسم خاطئ أي ما نسبته 5.8%. بينما احتوت مجموعة اختبار (
QuickDraw) من جوجل على أكثر من 5 مليون وسم خاطئ، بأعلى نسبة بلغت 10.1%. وقد أطلق الباحثون موقع ويب لعرض الأخطاء في كل مجموعة بيانات.
ومن شأن أخطاء الوسم في مجموعات البيانات أن تدفع الباحثين إلى استخلاص نتائج غير دقيقة حول أداء نماذج الذكاء الاصطناعي في العالم الحقيقي، مما يقودهم إلى اختيار نماذج لا تحقق مستوى الدقة التي يتوقعونها منها. لذلك يدعو الباحثون إلى الحُكم على أداء النماذج بعد اختبارها على مجموعات اختبار "موسومة بصورة صحيحة" قبل نشرها للاستخدام.
الرابط1 (إنجليزي)
الرابط2 (إنجليزي- موقع يستعرض الأخطاء في وسم البيانات)