لماذا يُعدّ تعليم الروبوتات المشي أكثر فائدة للبشر من تعليمها الركض؟

رأينا خلال السنوات القليلة الماضية الكثير من مقاطع الفيديو التي تُظهر مدى الرشاقة التي وصلت إليها الروبوتات ذات الشكل البشري، حيث أصبحت قادرة على الركض والقفز بسهولة. لم تعد هذه الرشاقة بالأمر المفاجئ، وفي الواقع، فقد باتت شيئاً متوقعاً بالنسبة إلينا. غير أن المشكلة تكمن في أن هذه التجارب اللافتة للنظر تفتقر إلى الواقعية والارتباط بتطبيقات العالم الحقيقي. فعند بناء الروبوتات المفيدة والقادرة على العمل بالقرب من البشر بصورة آمنة، فإن أساسيات الحركة تزداد أهمية. ولهذا، يستخدم الباحثون التقنيات نفسها لتدريب الروبوتات الشبيهة بالبشر على تحقيق أهداف أكثر تواضعاً بكثير.

اقرأ أيضاً: هل ستشهد الروبوتات البشرية طفرة مع دخول أوبن أيه آي المنافسة؟

أهداف أكثر تواضعاً وفائدة من تدريب الروبوتات

نجح أستاذ علوم الكمبيوتر في جامعة ولاية أوريغون، آلان فيرن، بالتعاون مع فريق من الباحثين، في تدريب روبوت يشبه الإنسان يحمل اسم “ديجيت في 3” (Digit V3) على الوقوف والمشي والتقاط صندوق ونقله من مكان إلى آخر. في هذه الأثناء، تمكنت مجموعة أخرى من الباحثين من جامعة كاليفورنيا في مدينة بيركلي من التركيز على تعليم ديجيت كيفية المشي في بيئات غير مألوفة خلال حمل أحمال مختلفة دون الوقوع أرضاً. وقد نُشِر بحثهم في ورقة بحثية في مجلة ساينس روبوتيكس (Science Robotics) مؤخراً. تستخدم كلتا المجموعتين تقنية تسمى بـ “التعلم المعزز للانتقال من المحاكاة إلى الواقع” (sim-to-real reinforcement learning)، وهي طريقة ناشئة لتدريب الروبوتات ثنائية الساقين مثل ديجيت. يعتقد الباحثون أن هذه الطريقة ستتيح بناء آلات ثنائية الساقين أكثر متانة ووثوقية، بحيث تصبح قادرة على التفاعل مع محيطها على نحو أكثر أماناً، إضافة إلى التعلم بسرعة أكبر.

يتضمن التعلم المعزز للانتقال من المحاكاة إلى الواقع تدريب نماذج الذكاء الاصطناعي على إنجاز مهام معينة في البيئات الافتراضية عدة مليارات من المرات قبل أن يحاول الروبوت الذي يعتمد على النموذج إنجاز هذه المهام في العالم الحقيقي. وسيتمكن الروبوت خلال أيام معدودة من تعلم أشياء قد يستغرق تعلمها في الحياة الواقعية عدة سنوات، وذلك بفضل تكرار اختبارات التجربة والخطأ ضمن المحاكاة. تتولى شبكة عصبونية مهمة توجيه الروبوت من خلال استخدام وظيفة مكافأة رياضية، وهي تقنية تكافئ الروبوت برقم كبير في كل مرة يتحرك فيها مقترباً من موقع الهدف، أو يتمكن من تحقيق السلوك المستهدف. أما إذا فعل الروبوت شيئاً لا يُفترض به أن يفعله، مثل الوقوع، فسوف يتعرض إلى “عقوبة” من خلال رقم سلبي، بحيث يتعلم تفادي هذه الحركات مع مرور الوقت.

تقنية التعلم المعزز نفسها لتعليم الروبوت

في مشاريع سابقة، استخدم باحثون من جامعة أوريغون تقنية التعلم المعزز نفسها لتعليم الروبوت ثنائي الساقين المسمى “كاسي” (Cassie) كيفية الركض. حققت هذه الطريقة النجاح، فقد أصبح كاسي أول روبوت يجري مسافة 5 كيلومترات في الهواء الطلق قبل أن يدخل سجل غينيس للأرقام القياسية بوصفه أسرع روبوت ثنائي الساقين في سباق المائة متر، إضافة إلى إتقان مهارة القفز من موقع إلى آخر بسهولة.

يتطلب تدريب الروبوتات على التصرف بأساليب رياضية تطوير مهارات معقدة للغاية ضمن بيئات محدودة للغاية، كما يقول طالب الدكتوراة في بيركلي، إيليا رادوسافوفيتش، الذي درب ديجيت على حمل مجموعة متنوعة من الأحمال، والعودة ذاتياً إلى وضع الاستقرار عند دفعه باستخدام العصا لإفقاده توازنه. ويقول: “نعمل على تدريب الروبوتات بصورة معاكسة تقريباً، حيث نركز على مهارات بسيطة نسبياً ضمن نطاق واسع من البيئات”. لا تركز هذه الموجة الجديدة من الأبحاث المتعلقة بالروبوتات الشبيهة بالبشر على السرعة والقدرات بقدر تركيزها على جعل الآلات أكثر استقراراً وقدرة على التكيف، وهو ما سنحتاج إليه في نهاية المطاف حتى نجعلها مفيدة في العالم الحقيقي.

ما زالت الروبوتات الشبيهة بالبشر نادرة نسبياً في بيئات العمل، حيث إنها تعاني في أغلب الأحيان صعوبة في التوازن في أثناء حمل الأجسام الثقيلة. ولهذا، تميل تصاميم أغلب الروبوتات المصممة لحمل الأجسام المتنوعة الأوزان في المصانع والمستودعات إلى أن تكون مزودة بأربعة أرجل أو قواعد أضخم وأكثر استقراراً. لكن الباحثين يأملون بتغيير هذا الوضع من خلال جعل الروبوتات الشبيهة بالبشر أكثر وثوقية بالاعتماد على تقنيات الذكاء الاصطناعي.

سيؤدي التعلم المعزز إلى فتح المجال أمام “طريقة جديدة وأكثر مرونة وسرعة بكثير لتدريب الروبوتات على هذا النوع من المهارات الحركية المعقدة”، كما يقول فيرن. من المقرر أن يقدم فيرن مع فريقه ما توصلوا إليه من نتائج في المؤتمر الدولي للروبوتات والأتمتة أو “إيكرا” (ICRA) اختصاراً، وذلك في اليابان بعد فترة قصيرة. تهدف هذه الأبحاث في نهاية المطاف إلى تمكين البشر من عرض مقطع فيديو على الروبوت لتوضيح المهمة المطلوبة، مثل التقاط صندوق من أحد الرفوف ووضعه على رف أعلى، بحيث يتمكن الروبوت من تنفيذ هذه المهمة دون الحاجة إلى أي توجيه إضافي، كما يقول فيرن.

إذا تمكنت الروبوتات من مراقبة هذه الأنواع من المهام والسلوكيات وتقليدها وتعلمها بسرعة، فسوف تصبح مفيدة للغاية، لكن تحقيق هذا الهدف ما زال تحدياً صعباً، كما يقول الأستاذ المساعد المختص بعلوم الكمبيوتر في جامعة نيويورك، ليريل بينتو، الذي لم يشارك في البحث. ويقول بينتو: “إذا تمكنا من تحقيق هذا الهدف، فسوف يكون إنجازاً رائعاً بالفعل. فهذه معضلات صعبة للغاية”.