خوارزميات الصندوق الأسود في الذكاء الاصطناعي تتحيز ضد عرق أو فئة عمرية معينة

3 دقائق

يزداد استخدام الذكاء الاصطناعي يوماً بعد آخر في عمليات اتخاذ القرار التي كانت فيما سبق منوطة بالبشر؛ مثل اختيار الأسهم وتفحُّص صور الأشعة السينية، لكن جودة الذكاء الاصطناعي تعتمد كلياً على جودة البيانات التي تدرَّب عليها، وفي الكثير من الحالات ينتهي بنا الأمر إلى إدراج تحيزاتنا البشرية في الخوارزميات التي من شأنها أن تتخذ قرارات لها آثار عظيمة على حياة الناس.

وقد قال الباحثون في ورقة بحثية جديدة نُشرت على موقع أركايف (arXiv) إن من المحتمل أنهم عثروا على طريقة لتخفيف مشكلة الخوارزميات التي يصعُب تفحصها من وجهة نظر خارجية، والتي تسمى عادةً بأنظمة "الصندوق الأسود".

وإن أهم النقاط المُشكِلة في قضية الانحياز تكمن في عملية "نمذجة تقدير المخاطر" التي بإمكانها مثلاً أن تتخذ قراراً بإطلاق سراح أحد الأشخاص بكفالة أو قبول طلب القروض، ومع أن الاهتمام بعوامل مثل "العِرق" في مثل هذه الحالات يعد أمراً غير قانوني، إلا أن الخوارزميات تستطيع أن تتعلم وتستخدم حقائق أخرى -مثل المستوى التعليمي للشخص أو مكان سكنه- في تكوين عوامل مرتبطة بالمعلومات الديموغرافية الأخرى، مما سيجرُّها إلى اتخاذ قرارات متحيزة وعنصرية.

ومما يجعل هذه المشكلة أكثر صعوبة هو أن الكثير من أنظمة الذكاء الاصطناعي -التي تُستخدم لاتخاذ مثل هذه القرارات- هي من نوع أنظمة "الصندوق الأسود" (أنظمة لا نعرف كيف يبدو نموذج عملها الداخلي)، والتي إما أن تكون معقَّدة جداً فلا يمكن فهمها بسهولة، وإما أنها تنطوي على خوارزميات محمية بقوانين الحقوق الفكرية، وترفض الشركات المالكة لها شرحها أو تفسيرها خوف سرقتها، ومع أن العلماء والباحثين قضوا الكثير من الوقت في إنشاء أدوات تسمح لهم بإلقاء نظرة على محتوى تلك "الصناديق السوداء"، إلا أن المشكلة تزداد انتشاراً ونمواً بوتيرة من الصعب مواكبتها.

وفي هذه الورقة البحثية الصادرة حديثاً، قامت سارة تان -التي كانت تعمل في مايكروسوفت في ذلك الوقت- وزملاؤها بتجريب طريقتهم على نموذجين من نماذج "تقدير المخاطر" من نوع الصناديق السوداء؛ أحدهما يتعلق بتقدير مخاطر منح القروض ومعدَّلات عدم السداد، وقد طورته شركة تعمل بمنهج الندِّ للندِّ، تُدعى لندينغ كلَب (LendingClub)، والآخر من شركة نورث بوينت  (Northpointe)، وهي شركة توفر خدمات قائمة على الخوارزميات للمحاكم في الولايات المتحدة الأمريكية، حيث تتوقع هذه الخوارزميات مدى احتمال أن يكرر المتهمون جرائمهم في المستقبل.

وقد استخدم الباحثون في عملهم نهجاً ذا شقين لإلقاء الضوء على كيفية عمل هذه الخوارزميات المُحتمل اتخاذها قرارات متحيِّزة، وأول ما قاموا به هو إنشاء نموذج يحاكي الخوارزمية التي يتم تفحُّصها، وخرجوا بسلَّم مخاطر يستند إلى مجموعة أولية من البيانات، تماماً كما تعمل خوارزميات كل من شركة لندينغ كلَب ونورث بوينت، وبعد ذلك قاموا بإنشاء نموذج ثانٍ درَّبوه على نتائج العالم الواقعي، واستخدموا هذا النموذج في تحديد المتغيرات الموجودة في مجموعة البيانات الأوَّلية، والتي أثَّرت كثيراً على النتائج النهائية.

وقد حلل الباحثون في شركة لندينغ كلَب البيانات المتعلقة بعدد القروض المستحقة (أي التي حلَّ موعد سدادها) للفترة ما بين 2007 إلى 2011، ومع أن قاعدة بيانات شركة لندينغ كلَب تضم شتى القطاعات والمجالات، إلا أن الباحثين قد وجدوا أن من المرجح أن يكون نموذج الذكاء الاصطناعي الذي تستخدمه الشركة يتجاهل كلاً من: الدخل السنوي لطالب القرض، والهدف من القرض؛ ومن المعقول في هذا الجانب أن يتم تجاهل الدخل السنوي، بما أنه معلومة يتم الإفصاح عنها ذاتياً ومن اليسير تزييفها، لكن الهدف من طلب القرض يبقى عاملاً وثيق الصلة بالمخاطر؛ حيث تعد القروض الممنوحة للمؤسسات الصغيرة مثلاً أكثر خطراً من القروض الممنوحة لتغطية تكاليف الزفاف، وهكذا اكتشف الباحثون أن نموذج شركة لندينغ كلَب يتجاهل عاملاً مهماً في حساباته.

أما شركة نورث بوينت فتقول إن خوارزميتها المسماة كامباس "COMPAS" (وهي اختصار لعبارة "إدارة الأحكام القضائية على المجرمين من أجل البحث عن عقوبات بديلة") لا تتضمن "العِرق" كمتغيِّر ضمن الخوارزمية عندما تشرع في حساباتها وتقترح توصياتها بشأن الحكم القضائي، ومع ذلك فقد كشف تحقيقٌ أنجزته مؤسسة بروبابليكا  (ProPublica) جمعَ فيه الصحفيون المعلومات العرقية عن المتهمين الذين حُكم عليهم بالاستعانة بخوارزمية كامباس، ووجد التحقيق عدة أدلة على التمييز العرقي. وفي النموذج الذي صُنع لمحاكاة خوارزمية كامباس، استخدم الباحثون البيانات التي جمعتها مؤسسة بروبابليكا، فضلاً عن مجموعة من المعلومات الأخرى التي تتضمن عمر المتهم وجنسه، ودرجة التهمة وعدد الإدانات السابقة، وفترات السجن التي قضوها في حال وجودها؛ وكانت نتائج البحث متوافقة مع النتائج التي توصلت إليها بروبابليكا، وتشير إلى أن خوارزمية كامباس متحيزة ضد بعض الفئات العمرية والعرقية.

ومع أن منتقدي هذه النتائج قد يقولون إن النموذج المُحاكي لا يمثل الخوارزمية المعنية بدقة، وإن الباحثين مضطرون قسراً إلى وضع الكثير من الافتراضات والتخمينات التي تسند مزاعمهم، إلا أن في حال عدم رغبة الشركة المطورة للخوارزمية في الكشف عن كيفية عمل نظامها فإنها تجعل من النماذج التقريبية -كالذي رأيناه في هذه الورقة البحثية- نماذج معقولة ومنطقية للخروج برؤى مفيدة، وذلك كما يقول بريندان أوكونور؛ الأستاذ المساعد بجامعة ماساتشوستس بأمهرست، والذي نشر ورقة بحثية عن التحيز في عمليات "معالجة اللغة الطبيعية".

ويختم أوكونور بقوله: "لا بد أن ندرك حقاً أن التحيز في الذكاء الاصطناعي واقع ولا يزال يقع فعلاً، ولا ينبغي علينا أن نتجاهل ذلك أو نتغافل عنه".