ما الذي ينقص خطة إيلون ماسك حتى تنجح في تحديد الحسابات المزيفة على تويتر؟

إيمي أوزبورن/ غيتي إيميدجيز

استمع الى المقالة الآن هذه الخدمة تجريبية

عندما يتعرض أثرى رجل في العالم لدعوى قضائية من قبل إحدى أكثر شركات التواصل الاجتماعي شعبية وانتشاراً في العالم، يُعتبر هذا خبراً يستحق الاهتمام. وعلى الرغم من أن معظم الحوارات حول محاولة إيلون ماسك للتراجع عن عقده البالغة قيمته 44 مليار دولار لشراء تويتر (Twitter) تتمحور حول النواحي المتعلقة بالقانون والتواصل الاجتماعي والأعمال، فلا بد من إيلاء بعض الاهتمام لأحد أكثر منتجات الصناعات التكنولوجية إثارة للجدل: الذكاء الاصطناعي.

قدرات الذكاء الاصطناعي

تلقي هذه الدعوى القضائية الضوء على إحدى أهم المسائل الأساسية التي يجب على الصناعة التعامل معها: ما الذي يمكن للذكاء الاصطناعي فعله، وما الذي يعجز عن فعله، وما الذي يجب أن يفعله، وما الذي يجب ألا يفعله؟ يكشف هذا الاشتباك غير المتوقع بين تويتر وماسك الكثير عن طريقة التفكير بالذكاء الاصطناعي في أوساط التكنولوجيا والشركات الناشئة، ويثير العديد من التساؤلات حول طريقة فهم وتطبيق التكنولوجيا في العديد من المجالات، بدءاً بالتحقق من الوضع الائتماني وصولاً إلى الرقابة الأمنية.

يمثل الادعاء بضعف أداء المنصة في كشف وإزالة الحسابات المزيفة جوهر ادعاءات ماسك بأحقيته في التراجع عن هذا العقد. وقد ادعت تويتر باستمرار في تقاريرها الربعية أن أقل من 5% من حساباتها النشطة هي حسابات مزيفة، على حين يعتقد ماسك أن النسبة أعلى من ذلك بكثير. من وجهة نظر قانونية، من المرجح أن وجود خطأ طفيف في تقديرات تويتر لنسبة الحسابات المزعجة ليس بالأمر المهم، كما أن تويتر كانت واضحة في التأكيد على أن هذا التقدير مبني على وجهات نظر محددة، وأنه يمكن لجهات أخرى أن تتوصل إلى تقديرات مختلفة اعتماداً على نفس البيانات. وقد يكون هذا سبب خسارة فريق ماسك القانوني في جلسة استماع في 19 يوليو/ تموز، عندما طلبوا المزيد من الوقت لإجراء تحليل مفصل حول جهود تويتر في مكافحة الحسابات المزيفة (والتي عادة ما تغرد بمحتوى مزعج)، ما يشير على الأرجح إلى أن هذا التساؤل لن يكون محور المحاكمة.

ادعاءات إيلون ماسك

وبغض النظر عن قوة الأساس القانوني، فإنه من الضروري تدقيق التفكير الإحصائي والتقني لماسك وفريقه. ويمكن تلخيص موقف ماسك بأفضل ما يمكن بهذه الوثيقة التي قدمها في 15 يوليو/ تموز، والتي تقول: “في اجتماع في 6 مايو/ أيار مع مسؤولي تويتر التنفيذيين، أصيب ماسك بالدهشة لدى اكتشافه لضعف عمليات المعالجة والتدقيق لدى تويتر”. وعلى وجه التحديد: “يختار المدققون البشر عشوائياً 100 حساب عشوائي في اليوم (أقل من 0.00005% من المستخدمين اليوميين) ويطبقون مجموعة من المعايير غير المحددة للاستنتاج بطريقة ما، وفي كل ربع سنة على مدى ثلاث سنوات تقريباً، ووجدوا أن أقل من 5% من مستخدمي تويتر عبارة عن مستخدمين مزيفين أو حسابات مزعجة”. وتتابع الوثيقة وصف دهشة ماسك بالقول: “هذا كل شيء. لا توجد أي أتمتة، أو ذكاء اصطناعي، أو تعلم آلي”. ومن المرجح أن أكبر دعم لحجج ماسك هنا أتى من مستثمر رأس المال ديفيد ساكس، والذي اقتبس كلامه معلناً: “لقد انتهى أمر تويتر”. ولكن شكوى ماسك تتضمن تناقضاً مثيراً للسخرية: فلو كانت تويتر تستخدم التعلم الآلي للتدقيق كما يعتقد أنها يجب أن تفعل، ولو كانت بالتالي تقوم بالتقاط الحسابات المزيفة المماثلة للحسابات المزيفة القديمة، فمن المرجح أنها كانت ستتوصل إلى تقدير أخفض وأقل دقة من التقدير الحالي.

يتضمن رأي ماسك ثلاث نواحٍ أساسية تستحق التدقيق، وهي ادعاؤه الإحصائي الأساسي حول العينة الإحصائية الكافية لتمثيل الوضع الحقيقي للمنصة، وادعاؤه بأن عملية التدقيق لكشف الحسابات المزيفة يجب أن تستخدم “الذكاء الاصطناعي” أو “التعلم الآلي“، والادعاء الضمني حول القدرات الفعلية للذكاء الاصطناعي.

فيما يتعلق بالمسألة الإحصائية، فهذا شيء يستطيع أي محترف في أي مجال قريب من التعلم الأساسي الإجابة عنه (وكذلك الكثير من طلبة المدارس الثانوية). تستخدم تويتر عينة يومية من الحسابات لتدقيق ما يقارب 9000 حساب في الشهر (أي 100 في اليوم تقريباً) للتوصل إلى تقديرها حول نسبة أقل من 5% للحسابات المزيفة. وعلى الرغم من أن عينة مؤلفة من 9,000 مستخدم في كل ربع سنة تُعتبر، كما يلاحظ ماسك، صغيرة للغاية بالنسبة للعدد الكلي من المستخدمين الذي أعلنت عنه الشركة في أوائل 2022، والبالغ 229 مليون نشط، فإن أي أستاذ في مجال الإحصاء (أو طالب) يمكن أن يقول لك إن هذا ليس بالأمر المهم. لا تكمن أهمية العينة الإحصائية في نسبتها من التعداد الكلي، بل في الحجم الفعلي للعينة نفسها. وكما قالت كاشفة أسرار فيسبوك (Facebook) صوفي زانغ، يمكن تشبيه هذا الوضع بالحساء: “لا يهم إذا كان لديك قدر ضخمة أو صغيرة من الحساء، فإذا كان الحساء متجانساً، تكفي ملعقة واحدة صغيرة لتذوقه”.

وفي الواقع، فإن الهدف من العينة الإحصائية في المقام الأول هو معرفة كل ما نحتاجه عن مجموعة ضخمة بدراسة قسم أصغر بكثير ولكن بحجم معقول. وسواء كان الشخص الذي ينتقي العينة عالماً يدرس البكتيريا، أو مفتش جودة مختصاً بالمصانع ويتحقق من معلبات الخضروات، أو مختص استبيان يسأل حول الميول السياسية، فإن السؤال المهم ليس “ما هي النسبة المئوية من المجموعة الكلية للمجموعة التي أدرسها؟” بل “إلى أي مدى يمكن أن أتوقع أن تكون عينتي ممثلة للمجموعة الكلية من حيث الخصائص التي أدرسها؟” إذا كنت مضطراً لفتح عدد كبير من علب الطماطم المعلبة للتأكد من جودتها، فستواجه صعوبة في تحقيق الأرباح، ولهذا، من الأفضل أن تتحقق من أقل عدد ممكن قادر على إعطائك نتيجة موثوقة.

وعلى حين يبدو هذا التفكير مناقضاً للمنطق السطحي (هناك سبب يدفع بالكثيرين إلى ارتكاب هذا الخطأ)، فهناك أيضاً طريقة تجعل هذه المقاربة في أخذ العينات أكثر بديهية. لنقم بصياغة هدفنا في تحديد حجم العينة كإجابة معقولة عن السؤال التالي: إذا سحبت عينة أخرى بنفس الحجم، فأي درجة من الاختلاف يمكن أن أتوقع وجودها بين هذه العينة والعينة الأساسية؟ ومن التشبيهات الكلاسيكية المستخدمة في شرح هذه المسألة يمكن أن نتخيل شراء كمية كبيرة من الكريات الصغيرة، والتي يُفترض أن تتوزع بنسب محددة، بحيث تكون نسبة 95 % من الكريات بنفسجية اللون، ونسبة 5% صفراء اللون. إذا أردنا التحقق من جودة عملية التوصيل، يمكن أن نعبئ الكريات في إحدى آلات السحب العشوائي، ونقوم بتشغيل الآلة، وإحصاء الكريات التي نسحبها من كل لون.

إذا فرضنا أن أول مجموعة من 20 كرية صغيرة تتضمن 19 كرية بنفسجية وواحدة صفراء، فهل يكفي هذا للثقة بالحصول على النسبة الصحيحة من البائع؟ من المرجح أن حدسك يقول لك إن المجموعة التالية المؤلفة من 20 كرية قد تكون مختلفة للغاية، فقد لا تتضمن أي كرية صفراء، وقد تتضمن سبع كريات. ولكن، ماذا سيحدث لو سحبنا 1,000 كرية، وهو ما يقارب الأرقام المستخدمة في استطلاعات الرأي السياسية العادية؟ وماذا لو سحبنا 9,000 كرية؟ كلما سحبنا كمية أكبر من الكريات، كلما زاد احتمال أن تكون المجموعة التالية مشابهة، لأن إخفاء التقلبات العشوائية أمر صعب في العينات الكبيرة.

وهناك برامج حسابية على الإنترنت تسمح لك بإجراء الحسابات بنفسك. فإذا سحبت 20 كرية وحصلت على واحدة صفراء، يمكنك أن تكون واثقاً بنسبة 95% بأن الكريات الصفراء تمثل 0.13% إلى 24.9% من الإجمالي، وهي نتيجة تفتقر إلى الدقة وضوحاً. أما إذا سحبت 1,000 كرية وحصلت على 50 كرية صفراء، يمكنك أن تكون واثقاً بنسبة 95% بأن الكريات الصفراء تمثل 3.7% إلى 6.5% من الإجمالي، وهي نتيجة أكثر دقة، ولكنها ليست بالنتيجة التي تستحق توقيعك على التقرير الربعي. وبسحب 9,000 كرية تتضمن 450 كرية صفراء، يمكنك أن تكون واثقاً بنسبة 95% بأن الكريات الصفراء تمثل 4.56% إلى 5.47%، ما يعني أن الدقة وصلت الآن إلى مجال أقل من نصف بالمئة، وعندها يصبح بإمكان محامي تويتر أن يقولوا إن هذا كافٍ للبيان العلني.

وهذه المعلومة الحقيقية، أي أن عملية دراسة العينات الإحصائية قادرة على إعطاء معلومات حول مجموعات كبيرة اعتماداً على مجموعات أصغر بكثير، تعتبر أساساً مهماً في كل مجال يتم استخدام الإحصاء فيه، بدءاً من التحقق من جودة الإسمنت المستخدم في البناء الذي تجلس حالياً فيه، وصولاً إلى ضمان وثوقية تدفق حركة مرور بيانات الإنترنت وصولاً إلى الشاشة التي تقرأ عليها هذه المقالة.

وهي أيضاً أساس جميع المقاربات الحالية للذكاء الاصطناعي. فالمختصون في هذا المجال لا يكادون يستخدمون مصطلح “الذكاء الاصطناعي” لوصف عملهم، مفضّلين استخدام مصطلح “التعلم الآلي”. ولكن توجد هناك طريقة أخرى لتوصيف المجال بأسره بوضعه الحالي، وهي باستخدام مصطلح “الإحصاء التطبيقي”. فالتعلم الآلي حالياً لا يعتمد على قيام الحواسيب بعمليات “تفكير” مشابهة للطريقة التي نفترض أن البشر يفكرون بها (قياساً بدرجة استيعابنا لطريقة تفكير البشر، وهي ليست بالدرجة المرتفعة)، بل يعتمد في معظم الأحيان على مطابقة الأنماط والتصنيف والتحديد، بناء على عمليات أمثَلَة إحصائية. فإذا قمت بتلقيم شبكة عصبونية بآلاف الصور من القطط والكلاب، وطلبت من النموذج الناتج أن يحدد ما إذا كانت الصورة التالية لكلب أو لقط، فمن المرجح أن تكون النتيجة جيدة، ولكن لا يمكنك أن تطلب منه أن يشرح لك الاختلافات بين الكلب والقط على أي مستوى، مهماً كان عمومياً، فعمله يقتصر فقط على التعرف على الأنماط في الصور، مستخدماً عدة طبقات من المعادلات الإحصائية.

عند ربط المعادلات الإحصائية بطرق معينة، يمكن بناء خوارزمية تعلم آلي تستطيع، عند تلقيمها بما يكفي من الصور، بناء تمثيل إحصائي بالتدريج للحواف والأشكال والأنماط الأكبر، إلى أن تستطيع التعرف على القطط بناء على التشابه مع آلاف صور القطط الأخرى التي تم تلقيمها بها. هناك أيضاً دور آخر للعينات الإحصائية: فنحن لا نحتاج إلى صور لجميع القطط والكلاب، بل ما يكفي فقط لبناء عينة جيدة التمثيل، بحيث تستطيع الخوارزمية استنباط كل ما يجب معرفته حول جميع الصور الأخرى للقطط والكلاب في العالم. وينطبق هذا على جميع الاستخدامات الأخرى للتعلم الآلي، مثل محاولة توقع راتب شخص ما باستخدام كل المعلومات الأخرى المعروفة عن هذا الشخص، وذلك باستخدام خوارزمية غابة عشوائية معززة، أو تقسيم قائمة من العملاء إلى مجموعات محددة، باستخدام خوارزمية عنقودية، مثل آلة المتجهات الداعمة.

لا يحتاج فهم التعلم الآلي إلى استيعاب الإحصاء بمستوى طالب درسه مؤخراً، ولكنه عامل مساعد ولا شك. ولهذا، فإن الأمية الإحصائية التي يستعرضها ماسك ومريدوه هنا تبدو مفاجئة بعض الشيء.

وعلى صعيد أكثر أهمية، فإن النجاح في الإشراف على بناء منتج تعلم آلي أو وضع تصور منطقي للاستثمار في شركة للتعلم الآلي أمر بالغ الصعوبة دون وجود أساس جيد في مبادئ التعلم الآلي، وأين وكيف يمكن تطبيقه بأفضل ما يمكن لحل مشكلة ما. وعلى الرغم من هذا، يبدو أن فريق ماسك يفتقر إلى هذه المعرفة.

التعلم الآلي لتدقيق حسابات تويتر

فإذا استوعبت أن كل التعلم الآلي حالياً يقوم بشكل أساسي على مطابقة الأنماط، سيصبح من الواضح أنه ليس من الممكن الاعتماد عليه لإجراء عمليات تدقيق مماثلة لما تقوم به تويتر للتحقق من نسبة الحسابات المزيفة. وفي مقابلة، تشرح خبيرة الأمن التي عملت في مناصب مهمة في شركات مثل سلاك (Slack) وهيروكو (Heroku)، لي هونيويل، قائلة: “تعتمد الشركة على التدقيق اليدوي لضمان بيانات عالية الجودة”. وتضيف: “أي بيانات تحصل عليها باستخدام التعلم الآلي ستكون بالضرورة أقل دقة من هذه البيانات”. فإذا اعتمدت على أنماط التزييف (والإزعاج) التي صادفتها سابقاً، وقمت بإدماج هذه الأنماط في أدوات كشف التزييف لتحديد نسبة التزييف على المنصة، فسوف تتعرف فقط على الأنماط المماثلة للأنماط القديمة من التزييف، ولن تتمكن من كشف أنماط جديدة.

أما المكان المناسب لتويتر لاستخدام الأتمتة والتعلم الآلي لكشف وإزالة الإزعاج فهو خارج عملية التدقيق، وهو ما يبدو أن الشركة تقوم به فعلياً. وإلا، سيستحيل على الشركة تعليق نصف مليون حساب يومياً وإقفال الملايين من الحسابات أسبوعياً، كما يزعم الرئيس التنفيذي للشركة، باراغ أغراوال. وفي الحوارات التي خضتها مع مختصي الأمن السيبراني في هذا المجال، تبين أنه من الواضح للغاية أن تويتر تستخدم قدراً كبيراً من تقنيات الأتمتة (على الرغم من أن التعلم الآلي على وجه التحديد نادر نسبياً في هذا المجال في الواقع، لأن النتائج غالباً ليست بجودة نتائج الطرق الأخرى، وذلك خلافاً لمزاعم شركات الأمن التي تقول إنها تعتمد على الذكاء الاصطناعي).

وعلى الأقل، وفي المزاعم العامة المتعلقة بهذه الدعوى القضائية، يشير كبار شخصيات وادي السيليكون إلى وجود وجهة نظر مختلفة لديهم حول ما يستطيع التعلم الآلي فعله، ومتى يُعتبر عديم الفائدة. إن هذا الانفصال بين “الذكاء الاصطناعي” الذي يتحدث عنه العديد من المدراء والقادة غير التقنيين في هذا العالم، والذكاء الاصطناعي الفعلي، سيؤثر بدرجة كبيرة في طريقة فهمنا لهذه التكنولوجيا واستخدامها في نهاية المطاف.

ويوجد فرق واضح بين العمل الفعلي في التعلم الآلي، والصورة التي يروّج لها الكثير من الشركات والقادة في هذه الصناعة، وغالباً ما يعزو علماء البيانات هذا الفرق إلى التسويق. فمن المألوف للغاية أن نسمع علماء البيانات وهم يقولون إن “الذكاء الاصطناعي ليس سوى مجرد مصطلح تسويقي” في الحوارات التي يخوضونها بين بعضهم بعضاً. كما أنه من المألوف للغاية أن نرى الشركات التي لا تستخدم التعلم الآلي على الإطلاق وهي تصف عملها بأنه “ذكاء اصطناعي” للمستثمرين والعملاء، والذين لا يدركون الفرق إلا فيما ندر، بل ويبدو حتى إنهم لا يكترثون بهذا الفرق.

هذه هي الحقائق الأساسية في عالم التكنولوجيا. ومن تجربتي في الحديث مع المستثمرين في تكنولوجيا “الذكاء الاصطناعي”، يبدو من الواضح للغاية في أغلب الأحيان أنهم يكادون لا يعرفون شيئاً حول المبادئ الأساسية للتعلم الآلي. لقد تحدثت مع رؤساء تنفيذيين لشركات كبيرة نوعاً ما، وتعتمد في جوهر عملها وإنتاجها على تقنيات جديدة في التعلم الآلي، وكان من الواضح لي أيضاً أنهم لا يدركون كيفية القيام بهذا العمل فعلياً.

إن التعامل بجهل أو عدم اكتراث مع كيفية عمل التعلم الآلي، وما يستطيع فعله وما لا يستطيع فعله، وأين يمكن أن يؤدي تطبيقه إلى مشكلات، قد يكون أمراً خطيراً على المجتمع. وإذا لم نفهم تفاصيل عمل التعلم الآلي، والتي تتلخص في أغلب الأحيان بكشف نمط ما في مجموعة بيانات وتطبيق هذا النمط على بيانات جديدة، يمكن أن ننحرف في مسارنا نحو تطبيقات خاطئة تزعم، على سبيل المثال، أن التعلم الآلي قادر على قياس أمانة الشخص وجدارته بالثقة اعتماداً على ملامح وجهه (عندما يكون هذا مبنياً بالكامل على استطلاعات يكشف فيها الناس عن تحيزاتهم الخاصة)، أو التنبؤ بالجريمة (حيث تكون الكثير من الجرائم المركزة في مناطق محددة مترابطة للغاية مع وجود المزيد من عناصر الشرطة في منطقة ما، والذين ينفذون عمليات اعتقال هناك)، بالاعتماد على نحو شبه كامل على مجموعة بيانات متحيزة أو ادعاءات خاطئة.

وإذا كنا نسعى إلى إدارة تأثير التعلم الآلي على المجتمع، وأنظمتنا ومؤسساتنا وحكومتنا، بشكل صحيح، يجب أن نحرص على توضيح هذه الفروقات. ويبدأ هذا بالعمل على تأسيس حد أدنى من محو للأمية الإحصائية، يليه الاعتراف بأن التعلم الآلي ليس سحراً، وليس “ذكاء” بأي معنى تقليدي للكلمة، وأنه يعمل بالاعتماد على مطابقة الأنماط الموجودة في البيانات، وأن البيانات تتضمن تحيزات مختلفة، وأن المشروع بأكمله يمكن أن يؤدي إلى نتائج مضللة، بل وحتى ضارة.

ونحن نتوقع أو نأمل على الأقل، بأن نجد هذا الاستيعاب لدى من يستثمرون جزءاً كبيراً من حياتهم وجهودهم وأموالهم في المشاريع المتعلقة بالتعلم الآلي. وإذا كان الأشخاص الذين يعملون على هذا المستوى لا يبذلون أي جهد للتمييز بين الحقائق والخيال، فهو نذير شؤم لنا جميعاً، وللجهات المنظِّمة والمسؤولين الذين يفترض بهم ضبط هذا العمل.