الذكاء الاصطناعي يتولى تعليم روبوت ثنائي الأرجل كيفية الركض والقفز

2 دقيقة
مصدر الصورة: هايبريد روبوتيكس عبر يوتيوب

إذا سبق لك أن شاهدت مقاطع الفيديو المسلية التي تظهر فيها روبوتات بوسطن ديناميكس (Boston Dynamics) وهي تركض وتقفز وتمارس رياضة الباركور، فقد يتهيأ لك أن الروبوتات تعلمت كيفية اكتساب رشاقة مذهلة. في الواقع، ما زالت هذه الروبوتات تعمل وفق رموز برمجية مكتوبة يدوياً، وتجد صعوبة كبيرة في التعامل مع أي عوائق جديدة لم تواجهها من قبل.

إلا أن طريقة جديدة لتعليم الروبوتات كيفية الحركة يمكن أن تساعد في التعامل مع السيناريوهات الجديدة، وذلك عبر التجربة والخطأ، تماماً كما يتعلم البشر مهارات التكيف مع الأحداث غير المتوقعة.

اقرأ أيضاً: هل ستشهد الروبوتات البشرية طفرة مع دخول أوبن أيه آي المنافسة؟

التدريب باستخدام التعلم المعزز

استخدم الباحثون تقنية ذكاء اصطناعي تحمل اسم "التعلم المعزز"، وذلك لمساعدة الروبوت الثنائي الأرجل المدعو "كاسي" (Cassie) على الركض مسافة 400 متر، فوق تضاريس متنوعة، وتنفيذ قفزات طويلة من الوقوف وقفزات عالية، دون أن يخضع إلى تدريب موجه يخص كلاً من هذه الحركات. يعمل التعليم المعزز من خلال تقديم المكافآت أو فرض العقوبات على الذكاء الاصطناعي في أثناء سعيه إلى تحقيق هدف محدد. في هذه الحالة، علمت هذه الطريقة الروبوت كيفية التعميم والاستجابة إلى سيناريوهات جديدة، بدلاً من الوقوف جامداً في مكانه على غرار أسلافه.

يقول طالب الدكتوراة في جامعة كاليفورنيا في مدينة بيركلي، وأحد العاملين على المشروع الذي لم يخضع بعد إلى مراجعة الأقران، تشونغيو لي: "أردنا أن نوسع نطاق الممكن فيما يتعلق برشاقة الروبوتات. وقد كان هدفنا الرئيس تعليم الروبوت كيفية تعلم أداء أنواع الحركات الديناميكية كلها على غرار البشر".

استخدم الفريق المحاكاة لتدريب كاسي؛ وهي طريقة تتيح تسريع عملية التعلم إلى درجة كبيرة، بحيث تستغرق بضعة أسابيع وحسب بدلاً من عدة سنوات، وتتيح للروبوت استخدام المهارات نفسها في العالم الحقيقي دون الحاجة إلى المزيد من الضبط الدقيق.

أولاً، درب الفريق الشبكة العصبونية التي تتحكم في كاسي على إتقان مهارة بسيطة من نقطة الصفر؛ مثل القفز في المكان نفسه، والسير إلى الأمام، والركض إلى الأمام دون أن يسقط. وقد تعلم الروبوت هذه المهارات من خلال تشجيعه على تقليد الحركات التي عُرِضت عليه، والتي تتضمن بيانات التقاط الحركة التي جُمِعت من البشر والرسوم المتحركة لتوضيح الحركات المطلوبة.

بعد إنجاز المرحلة الأولى، وجه الفريق إلى النموذج أوامر جديدة لدفع الروبوت إلى تأدية بعض المهام من خلال استخدام مهاراته الحركية الجديدة. بعد أن أصبح النموذج بارعاً في تأدية المهام الجديدة ضمن بيئة المحاكاة، نوّع الفريق المهام التي دُرِّب عليها باستخدام طريقة تسمى "التوزيع العشوائي للمهام".

اقرأ أيضاً: تطوير ذراع روبوتية يمكن التحكم بها عن طريق التنفس

روبوت مستعد لسيناريوهات غير متوقعة

وهو ما يجعل الروبوت أكثر استعداداً بكثير للسيناريوهات غير المتوقعة. على سبيل المثال؛ تمكن الروبوت من الحفاظ على استقرار حركات الركض في أثناء سحبه إلى الجانب باستخدام رسن مربوط به. يقول لي: "لقد سمحنا للروبوت باستخدام سجل الحركات التي عرضت عليه والتكيف بسرعة مع العالم الحقيقي".

قطع كاسي مسافة 400 متر ركضاً خلال دقيقتين و34 ثانية ثم نفذ قفزة أمامية بطول 1.4 متر في مضمار القفز الطويل دون الحاجة إلى أي تدريب إضافي.

يخطط الباحثون الآن لدراسة كيفية استخدام هذه التقنية لتدريب الروبوتات المزودة بكاميرات مدمجة. ستكون هذه العملية أصعب من أداء الحركات دون رؤية، كما يقول أستاذ علم الحاسوب في جامعة ولاية أوريغون، آلان فيرن، الذي ساعد على تطوير الروبوت كاسي، لكنه لم يشارك في المشروع.

اقرأ أيضاً: تعرّف إلى ميزات روبوت فيكس المصمم لتعليم البرمجة للأطفال والبالغين

ويقول: "الخطوة الرئيسة التالية في هذا المجال هي الروبوتات الشبيهة بالبشر التي تؤدي أعمالاً حقيقية، وتخطط للنشاطات، وتتفاعل في الواقع مع العالم الحقيقي بأساليب لا تقتصر على التفاعل بين القدمين والأرض".