لماذا تُعتبر لعبة البوكر مهمة للذكاء الاصطناعي؟

استمع الى المقالة الآن هذه الخدمة تجريبية

كما قال الفنان العظيم كيني روجرز في إحدى المرات، على اللاعب البارع أن يعرف متى يحتفظ بأوراقه ومتى يطرحها. وفي كازينو ريفرز في بيتسبيرج، ومع مطلع العام 2017، تمكن برنامج حاسوبي يسمى ليبراتوس من إثبات قدرة الحواسيب على فعل ذلك بشكل يفوق أي لاعب بشري.

خاض ليبراتوس الآلاف من مباريات البوكر بمختلف أنواعه ضد عدة لاعبين محترفين، وبعد مرور نصف المنافسة البالغة عشرين يوماً، تمكن من الفوز بحوالي 800,000 دولار من خصومه البشر، متجهاً نحو الفوز النهائي في ختام المنافسة.

يمثل فوز ليبراتوس إنجازاً هاماً في مجال الذكاء الاصطناعي؛ حيث يتطلب البوكر نوعاً من المنطق والذكاء الذي ثبتت صعوبة محاكاته بالنسبة للآلات. إنه مختلف جذرياً عن الداما والشطرنج وجو، لأن أوراق الخصم تبقى مخبأة خلال اللعب. وفي ألعاب “المعلومات الناقصة”، من الصعب للغاية وضع إستراتيجية مماثلة تأخذ بعين الاعتبار جميع الحركات الممكنة من الخصم، خصوصاً عندما يكون بوسع الخصم أن يراهن بأي مبلغ دون حدود. يقول آندرو إنج، العالم الرئيسي في بايدو: “يُعتبر البوكر من أصعب الألعاب بالنسبة للذكاء الاصطناعي. فلا توجد حركة مثالية واحدة، بل يجب عليه أن يقوم ببعض الحركات العشوائية بحيث يحتار الخصم فيما إذا كان يحاول خداعه”.

تم تصميم ليبراتوس من قِبل توماس ساندهولم، وهو بروفسور في قسم علوم الحاسوب في جامعة كارنيجي ميلون، إضافة لنوم براون، وهو أحد طلاب الدراسات العليا. ويرى ساندهولم -وهو خبير في نظرية الألعاب هاجر من فنلندا لتقديم رسالة الدكتوراه- أن من المذهل أن البشر تمكنوا من التفوق على الحواسيب في اللعب لهذه الفترة الطويلة، وقد قال قبل انتهاء المنافسة: “إن مهارة هؤلاء المحترفين تثير الدهشة. ومن بين جميع الألعاب التي أتقنها الذكاء الاصطناعي، فإن البوكر هي الوحيدة التي لم يتمكن فيها الذكاء الاصطناعي من تجاوز مستوى اللعب البشري”.

يعتمد باحثو الذكاء الاصطناعي على نظرية الألعاب، أو الرياضيات التي تعنى باتخاذ القرارات الإستراتيجية، وذلك لتحديد أفضل إستراتيجية -أو ما يسمى بالتوازن- بوجود عدة مجاهيل، ونظراً للعدد الهائل من الاحتمالات، فإن هذا القرار يتضمن عادة شكلاً من أشكال التقريب. يقول فنسنت كونيتزر، وهو بروفسور يعلِّم الذكاء الاصطناعي ونظرية الألعاب في جامعة ديوك: “إن صحة الحركة تعتمد على الأشياء التي لا يمكنك رؤيتها، وهو ما يؤدي أيضاً إلى وجوب أن تلعب بطريقة غير متوقعة. إذا لم تحاول الخداع على الإطلاق، فأنت لاعب غير بارع، وإذا كنت تحاول الخداع على الدوام، فأنت لاعب غير بارع. تخبرك نظرية الألعاب بالكيفية التي تجعل لعبك عشوائياً بطريقة يمكن القول إنها أمثلية”.

قاد ساندهولم في 2016 عملية تطوير برنامج سابق للعب البوكر باسم كلاوديكو، وقد تعرض لهزيمة نكراء أمام عدة محترفين بشر. ويشرح أن ليبراتوس يعتمد على عدة تطورات إضافية لتحقيق هذا المستوى المرتفع من اللعب، مثل أسلوب جديد لتقريب التوازن، إضافة إلى عدة طرق جديدة لتحليل النتائج الممكنة مع كشف المزيد من الأوراق في مراحل لاحقة من اللعب. إن تحليل نتيجة اللعبة بهذه الطريقة أمر فائق التعقيد من الناحية الحاسوبية، ويتم إجراؤه خلال كل لعبة في مركز بيتسبرج للحوسبة الخارقة، وهو منشأة تقوم بتشغيلها جامعة كارنيجي ميلون وجامعة بيتسبرج.

وقد أدت التطورات في التعلم الآلي والذكاء الاصطناعي إلى ظهور عدة برامج تتفوق على البشر في اللعب؛ ففي 2016، قام باحثو ديب مايند -وهي شركة تابعة لشركة ألفابيت- بتطوير برنامج قادر على التغلب على واحد من أفضل لاعبي جو في العالم. وقد كان هذا الإنجاز مذهلاً، لأن جو لعبة فائقة التعقيد، ولأن من الصعب قياس مدى التقدم ضمن اللعبة.

وتعمل بضع مجموعات بحثية مختلفة على لعبة البوكر، فقد قام فريق أكاديمي آخر، من جامعة ألبيرتا في كندا وجامعة تشارلز والمعهد التكنولوجي التشيكي في التشيك، بتطوير برنامج ديب ستاك، الذي تغلب على عدة محترفين في أحد أنواع البوكر. غير أن ساندهولم يقول إن اللاعبين الذين واجهوا ليبراتوس أكثر براعة بكثير، ولعبوا ضد الآلة عدداً أكبر من المباريات، وهو ما يعطي مصداقية إحصائية أكبر للنتيجة.

ويمكن الاستفادة من الأساليب المستخدمة لبناء برنامج ذكي يلعب البوكر في عدة تطبيقات في العالم الحقيقي. فقد تم تطبيق نظرية الألعاب من قبل على أبحاث في هجمات التشويش والأمن السيبراني، والتوجيه الآلي لخدمات التاكسي، والتخطيط الروبوتي، وذلك وفقاً لسام جانزفريد الذي شارك في تطوير كلاوديكو، وهو حالياً بروفسور مساعد في جامعة فلوريدا الدولية في ميامي.

غير أن انتصار ليبراتوس لا يعني انسحاب البشر من طاولة اللعب، حيث إن النسخة متعددة اللاعبين مسألة مختلفة تماماً، ولا يستطيع ليبراتوس إتقانها بنفس الأساليب.