Article image
مصدر الصورة: ياثيش جاودا عبر بيكساباي



اختبارات جديدة تضع نماذج التعلم الآلي في مواجهة البشر الذين يبذلون كل ما في وسعهم لخداعها.

2020-10-05 12:36:37

05 أكتوبر 2020

عادة ما تُعزى النجاحات الكاسحة التي حققها الذكاء الاصطناعي في العقد الأخير إلى استخدام كميات هائلة من البيانات مع قدرات حاسوبية ضخمة، غير أن المعايير تلعب أيضاً دوراً هاماً في عملية القياس، وهي الاختبارات التي يقوم الباحثون بإخضاع أنظمة الذكاء الاصطناعي إليها لقياس مدى تطورها. وعلى سبيل المثال، فإن قاعدة البيانات العامة إميج نت -التي تضم 14 مليون صورة- وضعت هدفاً يجب تحقيقه في مجال معالجة الصورة. كما أن قاعدة بيانات MNIST (قاعدة البيانات المعدلة للمعهد الوطني للمعايير والتكنولوجيا) قامت بنفس الشيء بالنسبة للتعرف على الكتابة بخط اليد، وقامت قاعدة بيانات GLUE (تقييم الفهم العام للغة) بنفس الشيء بالنسبة لمعالجة اللغة الطبيعية، ما أدى إلى تحقيق طفرات مذهلة في النماذج اللغوية، مثل جي بي تي 3.

غير أن الأهداف الثابتة سرعان ما يتم التغلب عليها؛ ولهذا تخضع قاعدة إميج نت للتحديث، كما استُبدلت جلو بقاعدة البيانات سوبر جلو، وهي مجموعة من المعايير اللغوية الأكثر صعوبة. وعلى الرغم من ذلك، فإن الباحثين سيتمكنون عاجلاً أو آجلاً من إيصال أنظمتهم إلى مستويات خارقة تفوق مستويات البشر في هذا التحدي أو في غيره. وهي مشكلة كبيرة إذا ما رغبنا في أن تستمر المعايير في دفع عملية التطور إلى الأمام.

ولهذا قررت فيسبوك أن تطلق نوعاً جديداً من الاختبارات التي تضع أنظمة الذكاء الاصطناعي في مواجهة البشر الذين يبذلون كل ما في وسعهم لإيقاعها في الخطأ. يحمل الاختبار اسم داينابينش، وسيتم تحديد مستوى صعوبته من قِبل الذين يقومون بإجرائه.

يقول دوي كيلا في قسم أبحاث الذكاء الاصطناعي في فيسبوك، والذي قاد الفريق الذي قام بتطوير الأداة، إن الاختبارات المعيارية قد تكون مضللة للغاية؛ حيث إن التركيز على المعايير أكثر من اللازم قد يعني الابتعاد عن الأهداف الشاملة، التي يصبح فيها الاختبار هو الهدف.

يقول كيلا: “يمكن أن تحصل في نهاية المطاف على نظام يتفوق على البشر في الاختبار، ولكنه ليس أفضل منهم في المهمة الإجمالية. إنه أمر مضلل للغاية؛ لأنه يجعلنا نعتقد أننا وصلنا إلى درجة من التقدم تفوق ما حققناه فعلياً”.

يعتقد كيلا أن هذه المشكلة واضحة على وجه الخصوص في أنظمة معالجة اللغة الطبيعية حالياً؛ حيث إن النماذج اللغوية، مثل جي بي تي 3، تبدو ذكية بسبب براعتها في تقليد اللغة. ولكن من الصعب أن نحدد مدى استيعاب هذه الأنظمة للغة فعلياً.

يضيف كيلا أن الأمر أشبه بمحاولة لقياس الذكاء البشري؛ حيث يمكنك إخضاع الناس إلى اختبارات الذكاء، ولكن هذا لن يساعدك على تحديد مدى استيعابهم لموضوع معين. ولهذا، يجب أن تتحدث معهم وتوجه الأسئلة إليهم.

يعتمد داينابينش على مبدأ مشابه، وذلك باستخدام البشر لاستجواب أنظمة الذكاء الاصطناعي. تم إطلاق الاختبار على الإنترنت منذ فترة وجيزة، ويتضمن دعوة المستخدمين للدخول إلى الموقع واستجواب النماذج التي تعمل في الخلفية. وعلى سبيل المثال، يمكنك أن تعطي صفحة من ويكيبيديا لنموذج لغوي، وتسأله عن محتوى الصفحة، وتضع علامات على إجاباته.

تبدو الفكرة، من بعض النواحي، شبيهة بالأساليب التي بدأ الناس يستخدمونها لتجريب جي بي تي 3 بهدف الترفيه لاختبار حدود قدراته، أو طريقة تقييم بوتات الدردشة في مسابقة لوبنر، التي تهدف إلى اختبار البوتات في قدرتها على محاكاة البشر. ولكن في داينابينش، فإن الإخفاقات التي تظهر أثناء الاختبارات يتم تلقيمها آلياً في النماذج اللاحقة، وهو ما يجعلها تتحسن باستمرار.

حالياً، سيركز اختبار داينابينش على النماذج اللغوية؛ لأنها من أكثر أنواع أنظمة الذكاء الاصطناعي قابلية للتفاعل مع البشر. يقول كيلا: “جميعنا نتكلم لغة ما. ولست في حاجة إلى معرفة حقيقية بكيفية إيقاع هذه النماذج في الخطأ”.

يُفترض بهذه الطريقة أن تكون ناجحة أيضاً بالنسبة لأنواع أخرى من الشبكات العصبونية، مثل أنظمة التعرف على الكلام أو الصور. ولسنا في حاجة إلا إلى طريقة تتيح للمستخدمين تحميل صورهم، أو رسم الأشياء، من أجل اختبار هذه الأنظمة، وفقاً لكيلا. ويضيف: “إن الهدف بعيد المدى لهذا المشروع هو أن يصبح مفتوحاً للجميع، بحيث يتاح لأي شخص أن يعدّ نموذجه على الموقع ويبدأ بجمع البيانات”.

“ونرغب في إقناع أوساط الذكاء الاصطناعي بأنه توجد أساليب أفضل لقياس تطور أنظمة الذكاء الاصطناعي. نأمل في أن يؤدي هذا العمل إلى تحقيق تقدم سريع وفهم أفضل يتيح تفسير إخفاقات نماذج التعلم الآلي حتى الآن”.