اشترك

الاستمرار بالحساب الحالي

شارك
شارك
Article image
انتقام مونتيزوما
مصدر الصورة: سكويكنت



هذه الخوارزمية تتذكر محاولاتها السابقة في اللعبتين، ويمكنها أن تزيد من نجاح الحواسيب والروبوتات في العالم الحقيقي.

بقلم

2021-07-29 13:48:47

05 ديسمبر 2018
استطاعت خوارزمية تعلم آلي من نوع جديد أن تُتقن لعبتي فيديو قديمتين أثبتتا أنهما صعبتان بالنسبة للذكاء الاصطناعي. ويعرف المتابعون أن خوارزميات الذكاء الاصطناعي تمكَّنت من التفوق على أفضل اللاعبين البشر في لعبة جو القديمة والبديعة، وهي من أصعب الألعاب على الإطلاق، غير أن باحثي الذكاء الاصطناعي وقفوا حائرين إزاء لعبتين قديمتين من حقبة ألعاب الفيديو بنظام 8 بت، وهما "انتقام مونتيزوما Montezuma’s Revenge" و"السقوط Pitfall!". وهناك سبب لهذا التناقض الظاهري؛ فعلى الرغم من البساطة الخادعة للعبتين، فقد تبين أنه لا يمكن إتقانهما بالتعلم المعزز، وهي تقنية كانت قد أثبتت فعاليتها في تعلم ممارسة ألعاب الفيديو ببراعة. وقد قامت شركة ديب مايند -وهي تركز على الذكاء الاصطناعي وتتبع لشركة ألفابيت- باستخدام هذه التقنية بشكل مشهور لتطوير خوارزميات قادرة على تعلم كيفية ممارسة عدة ألعاب فيديو كلاسيكية بمستوى احترافي. ويبدو أن التعلم المعزز يتوافق بشكل جيد مع معظم الألعاب، وذلك لأنه يؤدي إلى تعديل سلوك الخوارزمية بناء على التغذية الراجعة الإيجابية، وهي في هذه الحالة زيادة النقاط التي يحرزها اللاعب في اللعبة. وقد أدى نجاح هذه المقاربة إلى زيادة الأمل في أن خوارزميات الذكاء الاصطناعي قد تتمكن من تعليم نفسها الكثير من الأشياء المفيدة التي يستحيل فعلها على الآلات حالياً. أما المشكلة مع هاتين اللعبتين فهي قلة العلامات الإيجابية الدالة على المكافآت، وتتضمن كلتاهما نفس السيناريو النموذجي تقريباً، حيث يقوم بطل اللعبة باستكشاف عوالم بدائية الشكل، ولكنها مليئة بالمخلوقات والفخاخ القاتلة. ولكن في كل حالة، فإن أغلب الحركات والسلوكيات المطلوبة للتقدم في اللعبة لا تساعد على

أدخل بريدك الإلكتروني واقرأ المقال مجاناً

أنشئ حساباً مجاناً واقرأ مقالتين مجاناً كل شهر من أوسع تشكيلة محتوى أنتجته ألمع العقول العالمية والعربية.

مصطلح اليوم


HACKATHON

الهاكاثون

عبارة عن حدث إبداعي يجتمع فيه المبرمجون والأشخاص المهتمون بتطوير البرمجيات معاً لفترة زمنية قصيرة تمتد من يوم واحد إلى أسبوع كحد أقصى، وذلك بهدف التدريب أو حل المشكلات أو تطوير برمجيات وعتاد قابل للعمل في نهاية الحدث.