Article image
مصدر الصورة: VIENNA REYES | UNSPLASH



ابتكر علماء الذكاء الاصطناعي لدى جوجل محاكياً حوسبياً لكرة القدم من أجل تدريب الجيل التالي من خوارزميات التعلم الآلي.

تعتبر جوجل شركةً رائدة عالمياً في مجال البحوث المُنجزة حول موضوع ذكاء الآلة، لا سيما شركتها الفرعية “ديب مايند” التي لديها قائمة مذهلة من الإنجازات في هذا المجال؛ حيث تمكنت الشبكات العصبية التي طورتها “ديب مايند” من تحقيق أداءٍ فوق-بشريّ في طيف واسع من الألعاب. وتشمل قائمة الألعاب هذه: ألعاب فيديو شركة “أتاري” مثل “بونغ” (Pong)، وبريك آوت (Breakout)، وغزاة الفضاء (Space Invaders)، وتمتد لألعاب أكثر تعقيداً وصعوبة مثل اللعبة متعددة اللاعبين “ستار كرافت” (Starcraft) التي تُلعب في الوقت الحقيقي.

فضلاً عن هذا، حققت “ديب مايند” نجاحاً لافتاً للأنظار في ميدان الألعاب التقليدية؛ حيث حازت خوارزمية “ألفا جو” (AlphaGo) عام 2016 على الشهرة الكبيرة نظير فوزها على أحد أقوى لاعبي “جو” المحترفين على مستوى العالم، وهو نصر يعدّ الأول من نوعه بالنسبة لآلة، وذلك من ناحية طريقة تحقيقه؛ إذ اِكتشفت خوارزمية “ألفا جو” -أثناء لعبها مع المحترف البشري- طرقاً جديدة كلياً للعب قلبت رأساً على عقب المفاهيمَ البشرية السائدة عن طريقة لعب هذه اللعبة.

ولأن جوجل لم ترضَ بالعيش على أمجادها السابقة، صبّت الشركة اهتمامها الآن على ألعاب مفتوحة النهايات حيث يشكّل “العجز عن التنبؤ” أكبر الحواجز التي تعترض طريق اللاعب أمام الفوز. وهدفها التالي هو لعبة فيديو خاصة بكرة القدم.

وبهذا الصدد، طوّر كارول كوراش وزملاؤه في فريق البحث “جوجل برين” لعبة فيديو خاصة بكرة القدم سموها “بيئة كرة القدم البحثية الخاصة بجوجل” (Google Research Football Environment)، وذلك لكي يتمكن الباحثون والعلماء من اختبار خوارزمياتهم في عالم افتراضيّ قائم على القوانين الفيزيائية، وقابل للتخصيص، وسهل الاستخدام، وقابل لإعادة الإنتاج إلى ما لا نهاية. وجعلوا هذا العالم الافتراضي متاحاً للعموم وفق رخصة مفتوحة المصدر، مما يمكّن العلماء والباحثين من مختلف أصقاع العالم من استخدامه لتطوير خوارزميات أفضل في لعب كرة القدم. ولنلقِ أولاً نظرةً عن خلفية الموضوع.

يتمثل أحد التحديات التي تواجه باحثي الذكاء الاصطناعي في إيجاد مهام توفر مشاكل جديدة أمام خوارزميات التعلم الآلي. ولهذا غالباً ما تُعدّ ألعاب الفيديو الواضحة المهام -مثل بونغ أو بريك آوت- سهلةً جداً على هذه الخوارزميات؛ إذ إنها تتفوق على الأداء البشري بعد بضع ساعات فقط من التدرّب.

ومن الناحية الأخرى، تُعدّ بعض ألعاب الفيديو الأكثر تعقيداً مثل ستار كرافت صعبة للغاية، وحريّ بالذكر أنها لعبة إستراتيجية تُلعب في الوقت الحقيقي من قِبل عدة لاعبين، وتجري مبارياتها في عالَم افتراضي هائل الحجم على الإنترنت. وقد تنامى اهتمام الباحثين في مجال الذكاء الاصطناعي أكثر فأكثر بهذه اللعبة لأنها تتيح لخوارزمياتهم اللعب ضدّ البشر الآخرين، وضد نُظُم الذكاء الاصطناعي الأصلية في اللعبة، كلّ ذلك ضمن بيئات مُعقّدة.

بَيد أن اللعبة ذات كونٍ افتراضيّ فسيح للغاية وصعبة جداً لدرجة أنها تتطلب موارد حوسبية هائلة لجمع البيانات المعنية وتدريب خوارزمية تعلم آلي عليها؛ وتلك الموارد الهائلة المطلوبة غير متاحة في متناول معظم الباحثين.

أما المشكلة الأخرى فتتمثل في أن العديد من البيئات الرقمية الهامّة تقوم على برمجيات محمية بموجب حقوق الملكية الفكرية، مما يمنع الباحثين من تغييرها، بل حتى مجرد النظر إلى أكوادها. وهذا ما يعني أنه يستحيل على الباحثين معرفة كيف تتخذ اللعبة قراراتها الحاسمة، أو تجربة عمليات مختلفة لصنع القرار داخل اللعبة.

وأخيراً هناك مشكلة كَوْن الكثير من الألعاب حَتْميَّة تماماً، أي أنها ستعطي دوماً نفس المُخرجات في حال أدرجت نفس المُدخلات. وهذا ما يجعلها ألعاباً بسيطة ومباشرة بالنسبة لخوارزميات التعلم فتتغلب عليها بسرعة.

لكن من البديهي أن العالم الحقيقي مختلف عن هذا النمط من الألعاب؛ حيث تعتبر القدرة على التكيف مع الحوادث غير المتوقعة من أهمّ المهارات المطلوبة. والطريقة الوحيدة أمام الآلات لاكتساب هذه المهارة هي التدرّب في بيئات غير مُتوقعة، ومع ذلك ينبغي أن يكون مستوى “اللاتوقع” قابلاً للضبط، حيث يكون منخفضاً جداً واللعبة سهلة نوعاً ما؛ لأن الكثير منه يجعل عملية التعلم صعبة جداً على الآلة. بيد أن صناعة مثل هذه البيئة الافتراضية ليست عملية سهلة.

وهنا نأتي للحديث عن مُحاكيات مباريات كرة القدم؛ إذ تمتلك هذه المُحاكيات مستويات معينة من “القدرة على التوقع” قائمة على القوانين الفيزيائية للعبة، لكنها تحتوي أيضاً على مستويات كبيرة من “اللاتوقع” الناجمة عن التكتيكات التي ينتهجها اللاعبون الخصوم، فضلاً عن عدم التوائم بين اللاعبين في عدة وضعيات رياضية مثل العرقلة وغيرها.

ولهذا السبب أنشأ كوراش وزملاؤه مُحاكيهم الخاص بلعبة كرة القدم. حيث استخدم الباحثون -كنواة لمحاكيهم- لعبةً متاحة للعموم (مفتوحة المصدر) اسمها “جيم بلاي فوتبول” (Gameplay Football)، تتيح للمستخدمين لعب مباريات كرة قدم كاملة، بالأهداف والمخالفات ورميات الزوايا والعقوبات وحالات التسلل… إلخ. وبهذا الصدد، يقول فريق بحث جوجل: “إن بيئة كرة القدم البحثية الخاصة بجوجل توفر محاكاة ثلاثية الأبعاد للعبة كرة القدم قائمة على القوانين الفيزيائية الحقيقية، حيث يتطلب الأمر من اللاعبين التحكم بفريقهم وتعلم كيفية تمرير الكرة بينهم، والتغلب على دفاع منافسيهم بغرض تسجيل الأهداف”.

وقد عدّل الباحثون هذه اللعبة لتوفّر معياراً لنجاح الآلات التي تمارسها، بناءً على مدى قدرة الآلة على المراوغة واقترابها بالكرة من مرمى الخصم، بطريقة قابلة للضبط والمراقبة. وهذا المعيار ضروري، لأن المعيار العادي للنجاح -المتمثل في تسجيل الأهداف- يعدّ حدثاً نادراً في المباراة لاتخاذه مقياساً ولا يوفر للآلات طريقة معتبرة لرصد تقدمها على مرّ الزمن.

مباراة: جوجل ضد العالَم.

فضلاً عن هذا، أنشأ الفريق أيضاً العديد من البيئات القياسية المتفاوتة في مستوى التعقيد، وجعلها متاحة أمام الباحثين ليُدربوا عليها ويختبروا بها خوارزميات الذكاء الاصطناعي. وتشمل قائمة المهام التي ينبغي على الآلة أداؤها: تسجيل الأهداف في مرمى فارغ، والركض باللاعبين والتسجيل مع وجود حارس مرمى، وإتقان المراوغة في حالة وجود ثلاثة لاعبين أمام واحد بالتزامن مع محاولة التسجيل مع ضرورة تمرير الكرة من لاعب لآخر، وما إلى ذلك. ويتمثل الاختبار العام في مباراة كرة قدم عادية تخضع لجميع القوانين المعروفة للعبة، تُلعب ضدّ خصم آليّ.

ومع ذلك من الممكن أن تلعب خوارزمية التعلم المُراد تدريبها ضد خوارزميات تعلم أخرى أو ضدّ لاعبين من البشر، هذا ما يُكسب الخوارزمية خبرةً بمجموعة كبيرة من الإستراتيجيات. كما أن اللعب ضدّ مختلف الخوارزميات والبشر يجنب الخوارزمية الاكتفاء بتعلم نقاط ضعف الخصم الآلي (الحاسوبي)؛ وذلك ببساطة لأن نقاط الضعف تلك قد لا توجد في المباريات الأخرى. ومن جانبه، يقول الباحث كوراش وزملاؤه “إن هذا المحاكي يوفر مشكلة صعبة من مشاكل التعليم المعزّز، لأن الفوز في مباريات كرة القدم يتطلب من اللاعب توازناً طبيعياً بين التحكم قصير المدى، والمفاهيم المكتسبة السابقة، مثل إتقان التمرير، واتباع إستراتيجية عالية المستوى”.

وهذا ما يعد عملاً لافتاً لأنه يساعد خوارزميات التعلم الآلي على العمل ضمن بيئات شبيهة بالواقع. لكنه أيضاً يجعلنا نفكّر في احتمالية أن الآلات ستتعلم إستراتيجيات جديدة في لعب كرة القدم لم يفكّر فيها البشر من قبل، تماماً كما حدث مع لعبة “جو”.

وهذه الإستراتيجيات الجديدة قد تُتبع في بطولات كرة القدم الحقيقية التي يؤديها فريقان من الروبوتات، بل حتى في المباريات بين فريقين من البشر.

أما السؤال عما إذا كانت تلك الاستراتيجيات ستنجح في العالم الواقعي كما نجحت في المُحاكاة الافتراضية أم لا، فهو سؤال لافت نتطلع لأن نكتشف جوابه يوماً ما. وما من شك في أن رحلة الإجابة عنه ستكون مغامرة ممتعة للباحثين في حقل الذكاء الاصطناعي وعشّاق كرة القدم على حدّ سواء.

المرجع: arxiv.org/abs/1907.11180:
بيئة كرة القدم البحثية الخاصة بجوجل: بيئة جديدة لنماذج التعليم المعزّز


شارك