Article image




ديب مايند تطور برامج ذكاء اصطناعي قائمة على التعلم المعزز تستطيع العمل بشكل جماعي للفوز على البشر في لعبة كوايك 3 أرينا.

2020-10-31 16:02:08

12 يونيو 2019

تمكنت خوارزميات التعلم العميق من إتقان ألعاب مثل ستاركرافت لدرجة التغلب على البشر، والآن يبدو أن الذكاء الاصطناعي قادر على هزيمتنا عن طريق العمل الجماعي أيضاً.

التعلم المعزز “من أجل الفوز” في اللعبة

في بحث نُشر مؤخراً في مجلة Science، بينت ديب مايند كيف أطلقت العنان لبرامج الذكاء الاصطناعي التي صممتها في نسخة معدَّلة من لعبة الاشتباكات النارية ثلاثية الأبعاد كوايك 3 أرينا. وقد استخدم الفريق خوارزمية باسم “من أجل الفوز”، وهي تقوم بتدريب مجموعة من البرامج المستقلة على التوازي باستخدام التعلم المعزز، وهو الأسلوب الذي يسمح للذكاء الاصطناعي بمعرفة التكتيكات الناجحة والفاشلة (وهو ما مكَّن الذكاء الاصطناعي من ديب مايند بتحقيق فوز شهير في لعبة جو). وفي هذه المرة، تم تدريب البرامج المستقلة على حوالي 450,000 مباراة من لعبة الاستيلاء على العَلم، وهي لعبة كلاسيكية تقوم على اختطاف العَلم من قاعدة الخصم وحماية عَلمك في نفس الوقت.

ويمكن لكل برنامج أن يرى من بنية المتاهة (وهي ساحة اللعب) فقط ما يمكن أن يراه اللاعب البشري في نفس الوضع، وقد تم توزيع هذه البرامج على فرق مع 40 لاعباً بشرياً، وتنظيم مباريات عشوائية بينها، سواء بصفتهم خصوم أو شركاء في اللعب. ولجعل التحدي أكثر صعوبة، تم توليد خرائط ساحات اللعب بشكل متغير، أي أنه لم تكن هناك خريطتان متشابهتان.

برامج الذكاء الاصطناعي تطور إستراتيجية العمل الجماعي

دائماً ما كانت فرق برامج الذكاء الاصطناعي أفضل من الأزواج الأخرى، وقد طورت إستراتيجيات للعمل الجماعي لمساعدتها على الفوز، بما في ذلك تتبع أفراد الفريق للتفوق عددياً على الخصوم في لحظات هامة، والانتظار قرب قاعدة العدو لالتقاط راية جديدة عند ظهورها. ويمكن مشاهدة مقطع فيديو لهذه البرامج أثناء خوضها المنافسة هنا.

تطبيقات في العالم الحقيقي؟

هذا العمل (الذي نُشر لأول مرة على موقع arXiv للنشر السابق قبل التحكيم في العام الماضي) يُعتبر مثيراً للاهتمام؛ لأن تعاون الذكاء الاصطناعي ليس بالعملية السهلة، حيث يتضمن الكثير من المتحولات، كما أن جميع البرامج كانت تتعلم بشكل إفرادي. وهناك فكرة تقول بأن هذا العمل قد يساعد الروبوتات على العمل في العالم الحقيقي بشكل أكثر فعالية، سواء مع بعضها البعض أو مع البشر.

إلا أن علينا التزام الحذر، ويجب ألا نتوقع الكثير؛ حيث إن اللعبة كانت محددة كثيراً، ومن المرجح أنه لا يمكن نقل النظام ببساطة إلى سيناريو آخر، فضلاً عن الحياة الحقيقية. وعلى أية حال، فإن برامج الذكاء الاصطناعي لم تكن تتعاون بشكل فعلي (على الأقل ليس عن طريق التواصل بشكل مشابه للبشر)، كما قال مارك ريدل من معهد جورجيا للتكنولوجيا لنيويورك تايمز.