جوجل ديب مايند تدرب روبوتاً للتغلب على البشر في تنس الطاولة

ملخص:

المشكلة: محدودية قدرة الروبوتات على الحركة في الحياة الواقعية.

السبب: صعوبة محاكاة الحركات المطلوبة لإنجاز ذلك، بسبب تعقيد الحركة البشرية نفسها.

الحل: العمل على تدريب الروبوتات على أداء مهام العالم الحقيقي، بالاعتماد على بيانات ضخمة عن الحركة والاستجابة البشرية.

هل تتخيل فرصك في التغلب على روبوت في لعبة تنس الطاولة؟ أعلنت شركة جوجل ديب مايند (Google DeepMind) أنها دربت روبوتاً على لعب هذه اللعبة بمستوى أداء تنافسي يكافئ مستوى الهواة. وتزعم الشركة أنها المرة الأولى التي يتعلم فيها روبوت كيفية اللعب مع البشر مع التحلي بمهارات تضاهي مستواهم في لعبة رياضية.

تمكن الباحثون من تصميم ذراع روبوتية تحمل مضرباً مصنوعاً بالطباعة الثلاثية الأبعاد، وفازت هذه الذراع في 13 مباراة من أصل 29 مباراة تنافسية كاملة خاضتها ضد خصوم من البشر بمستويات مختلفة في لعبة تنس الطاولة. نشر الباحثون هذه الورقة البحثية في موقع أركايف (Arxiv).

إنجاز غير مسبوق على الرغم من أنه غير مثالي

لكن النظام ليس مثالياً على الإطلاق. فعلى الرغم من أن الروبوت تمكن من التغلب على خصومه البشر من المستوى المبتدئ جميعاً وعلى 55% من الخصوم من مستوى الهواة في لعبة تنس الطاولة، فقد خسر مبارياته ضد اللاعبين الأمهر جميعاً. غير أن هذا العمل ما زال على أي حال إنجازاً مثيراً للإعجاب.

"حتى منذ بضعة أشهر وحسب، كانت التقديرات الواقعية تشير إلى أن الروبوت قد لا يتمكن من التغلب على أشخاص لم يلعب ضدهم من قبل. ومن المؤكد أن النظام تجاوز توقعاتنا"، كما يقول أحد كبار مهندسي البرمجيات في جوجل ديب مايند، باناغ سانكيتي، الذي قاد المشروع. ويضيف قائلاً: "لقد أصبنا بالصدمة عندما تمكن الروبوت من التفوق في اللعب حتى على الخصوم الأقوياء".

الهدف ليس بناء روبوتات للعب فقط

غير أن هذا البحث لا يتعلق بالتسلية والألعاب فقط. في الواقع، يمثل هذا البحث خطوة إلى الأمام نحو بناء روبوتات تستطيع تأدية مهام مفيدة ببراعة وأمان ضمن بيئات حقيقية، مثل المنازل والمستودعات، وهو أحد الأهداف التي كانت أوساط مختصي الروبوتات تعمل على تحقيقها منذ زمن طويل. يمكن تطبيق أسلوب جوجل ديب مايند في تدريب الآلات على الكثير من المجالات الأخرى في هذا الحقل، كما يقول الباحث في علم الكمبيوتر في جامعة نيويورك، ليريل بينتو، الذي لم يشارك في المشروع.

ويقول: "يسرني كثيراً أن أرى الأنظمة الروبوتية وهي تعمل فعلياً مع البشر الحقيقيين وفي محيطهم، وهذا العمل مثال رائع على ذلك. قد لا يكون هذا الروبوت لاعباً بارعاً للغاية، لكنه يمتلك العناصر الأولية اللازمة لمواصلة التحسن والوصول إلى مستوى عالٍ في نهاية المطاف".

كيف تمكّن الروبوت من محاكاة قدرة البشر على لعب تنس الطاولة؟

لممارسة لعبة تنس الطاولة ببراعة، يحتاج البشر إلى تنسيق ممتاز بين اليد والعين، أي القدرة على التحرك بسرعة واتخاذ قرارات سريعة للرد على الخصم، وهي كلها تحديات كبيرة بالنسبة إلى الروبوتات. استخدم باحثو جوجل ديب مايند أسلوباً مؤلفاً من مرحلتين لتدريب النظام على محاكاة هذه القدرات، فقد استخدموا عمليات المحاكاة الحاسوبية لتدريب النظام على إتقان مهارات ضرب الكرة، ثم ضبطه بصورة دقيقة باستخدام بيانات من العالم الحقيقي، ما يسمح له بالتحسن مع مرور الوقت.

عمل الباحثون على تجميع مجموعة بيانات تعبر عن حالات كرة تنس الطاولة، بما في ذلك بيانات حول الموضع، والدوران، والسرعة. اعتمد النظام على هذه المكتبة ضمن بيئة محاكاة مصممة للتعبير بدقة عن العمليات الفيزيائية التي تجري في مباريات تنس الطاولة، وذلك حتى يتعلم مهارات مثل رد إرسال الخصم، وضرب الكرة ببطن المضرب مع دوران أمامي، أو ضربها بظهر المضرب. ونظراً إلى أن القيود التي يفرضها تصميم الروبوت تعني أنه لا يستطيع تنفيذ إرسال أولي للكرة، فقد جرى تعديل المباريات في العالم الحقيقي حتى تأخذ هذه النقطة بعين الاعتبار.

خلال المباريات في مواجهة البشر، يجمع الروبوت بيانات حول أدائه حتى تساعده على تحسين مهاراته. ويتتبع موضع الكرة باستخدام البيانات التي يلتقطها زوج من الكاميرات، ويتتبع أسلوب اللعب لدى خصمه البشري عبر نظام التقاط حركة يستخدم مجموعة من المصابيح الثنائية الباعثة للضوء (LED) على مضرب الخصم. يجري تلقيم بيانات الكرة إلى بيئة المحاكاة من أجل التدريب، ما يؤدي إلى إنشاء حلقة مفرغة من البيانات المتعاقبة (التغذية الراجعة التي تساعد على التصحيح والضبط).

تتيح هذه التغذية الراجعة للروبوت اختبار مهاراته الجديدة حتى يحاول التغلب على خصومه، ما يعني أنه يستطيع أن يعدل تكتيكاته وسلوكه، على غرار البشر تماماً. ويعني هذا أنه يتحسن باستمرار، سواء خلال مباراة معينة، أو مع مرور الوقت مع ازدياد عدد المباريات التي يخوضها.

كان النظام يواجه صعوبة في ضرب الكرة عندما كانت تتلقى الضربة بسرعة عالية للغاية، أو تخرج خارج نطاق رؤيته (أعلى من الطاولة بمسافة 1.8 متر تقريباً)، أو تكون منخفضة للغاية، بسبب مجموعة خاصة من الضوابط تفرض عليه تجنب التصادم الذي يمكن أن يؤذي مضربه. وقد تبين أن التعامل مع الكرات الدوارة صعب بالنسبة له، لأنه كان يفتقر إلى القدرة على إجراء قياس مباشر للدوران، وهي نقطة ضعف سارع اللاعبون المهرة إلى استغلالها.

تصنيع روبوتات تحاكي العالم الحقيقي

إن تدريب روبوت على التعامل مع الاحتمالات الممكنة كلها ضمن بيئة محاكاة يمثل تحدياً حقيقياً، كما يقول مؤسس شركة الروبوتات ميترا (Mytra) والرئيس السابق لفريق الروبوتات في شركة تسلا (Tesla)، كريس والتي، الذي لم يشارك في المشروع.

ويقول: "إن محاكاة العالم الحقيقي أمر صعب للغاية، لأنه ينطوي على العديد من المتغيرات، مثل نفحة من الرياح، أو حتى الغبار على الطاولة. وإذا لم تكن المحاكاة واقعية للغاية، فسيكون أداء الروبوت محدوداً".

تعتقد جوجل ديب مايند أنه يمكن التعامل مع هذه القيود من خلال عدد من الأساليب مختلفة، بما في ذلك تطوير نماذج ذكاء اصطناعي تنبؤية مصممة لتوقع مسار الكرة، واستخدام خوارزميات أفضل لكشف التصادم.

والأهم من ذلك، هو أن اللاعبين البشر استمتعوا بمبارياتهم ضد الذراع الروبوتية. حتى إن المنافسين المهرة الذين تمكنوا من التغلب على الروبوت قالوا إنهم وجودوا التجربة ممتعة وجذابة، وقالوا إنهم شعروا بأن هذا الروبوت قد يصلح شريكاً في التدريبات الحركية لمساعدتهم على صقل مهاراتهم.

وقد قال أحد المشاركين في الدراسة: "أود بالتأكيد أن أتخذه شريكاً في التدريب، حتى ألعب معه بعض المباريات بين الحين والآخر".