يجب أن تعلم | للاطلاع | في صلب الموضوع | رقم اليوم | شخصية اليوم | مصطلح اليوم
لست وحدك: جوجل أيضاً ترتكب هذا الخطأ الفادح في الذكاء الاصطناعي
أظهر مقال نُشر الشهر الماضي أن أكثر من 30% من البيانات التي استخدمتها جوجل في أحد نماذج التعلم الآلي الخاصة بها تم وسمها بشكل خاطئ. لم يكن النموذج نفسه مليئاً بالأخطاء فحسب، بل كانت بيانات التدريب الفعلية التي استخدمها هذا النموذج نفسه مليئة بالأخطاء. كيف يمكن لأي شخص يستخدم نموذج جوجل أن يأمل في الوثوق بالنتائج إذا كان مليئاً بالأخطاء؟
جوجل ليست وحدها التي وسمت كمية كبيرة من البيانات بشكل خاطئ، فقد وجدت دراسة أجرتها جامعة إم آي تي في عام 2021 أن ما يقرب من 6% من الصور في قاعدة بيانات "إيمدج نت" (ImageNet) المعيارية موسومة بشكل خاطئ. علاوة على ذلك، وجدت الدراسة "أخطاء في الوسم في 10 من أكثر مجموعات البيانات شيوعاً في مجالات الرؤية الحاسوبية واللغات الطبيعية والبيانات الصوتية". كيف يمكننا أن نثق في هذه النماذج أو نستخدمها إذا كانت البيانات المستخدمة لتدريب تلك النماذج سيئة للغاية؟
الجواب هو أنه لا يمكنك الوثوق بتلك البيانات أو تلك النماذج. وكما يقال في مجال الذكاء الاصطناعي: إدخال القمامة يخرج قمامة. إذا كانت جوجل و"إيمدج نت" وغيرهما يرتكبون هذا الخطأ، فمن المؤكد أنك ترتكب هذا الخطأ أيضاً.
يُظهر بحثاً أجرته شركة (Cognilytica) أن أكثر من 80٪ من الوقت الذي يستغرقه مشروع الذكاء الاصطناعي يُقضى في إدارة البيانات، بدءاً من جمعها إلى تنظيفها ووسمها. ولكن بالرغم من كل هذا الوقت المستغرق، لا بد أن تحدث الأخطاء. هذا إن كانت البيانات جيدة من البداية، فالبيانات السيئة تعني نتائج سيئة. وهذا هو الحال بالنسبة لجميع أنواع المشروعات الموجهة بالبيانات لعقود من الزمن، وهي الآن مشكلة كبيرة لمشروعات الذكاء الاصطناعي أيضاً، التي تعتبر في الأساس مجرد مشروعات بيانات ضخمة.
البيانات هي جوهر الذكاء الاصطناعي. ما يحرك مشروعات الذكاء الاصطناعي والتعلم الآلي ليس الرموز البرمجية، وإنما البيانات التي يتم التعلم منها. في كثير من الأحيان، تسرع المؤسسات في مشروعات الذكاء الاصطناعي الخاصة بها لتدرك لاحقاً أن الجودة الرديئة لبياناتها تتسبب في فشل أنظمة الذكاء الاصطناعي الخاصة بها. إذا لم تكن لديك بياناتك في حالة جيدة، فلا تتفاجأ عندما تتعرض مشروعات الذكاء الاصطناعي الخاصة بك للدمار.
الرابط (إنجليزي)
تعرف على الحرب الخفية بين المؤثرين وخوارزميات وسائل التواصل الاجتماعي
في الصيف الماضي، نشر أحد منتجي منصة تيك توك، زيغي تايلر، مقطع فيديو يتحدث فيه عن اكتشافه مشكلة مثيرة للقلق في كرييتور ماركت بليس (Creator Marketplace)، وهي أداة ضمن التطبيق للربط بين المنتجين والعلامات التجارية التي تريد أن تدفع لقاء رعايتها للمحتوى.
قال تايلر إنه لم يتمكن من إدخال بعض الجمل في حسابه على ماركت بليس، مثل شعار أرواح ذوي البشرة السمراء مهمة (Black Lives Matter)، ودعم تميز ذوي البشرة السمراء (supporting Black excellence)، لكن بعض الجمل الأخرى، مثل تفوق العرق الأبيض (white supremacy) ودعم تميز ذوي البشرة البيضاء (supporting white excellence) كانت مسموحة.
وإذا أمضيت فترة طويلة على تيك توك، فمن المرجح أنك شهدت نقاشات حول حوادث مماثلة بين المنتجين. هناك طريقتان لمحاولة فهم أثر مراقبة المحتوى والخوارزميات التي تفرض هذه القواعد، إما بالاعتماد على ما تقوله المنصات، أو بسؤال المنتجين أنفسهم. وفي حالة تايلر، قدمت منصة تيك توك اعتذارها وألقت باللائمة على أحد الفلاتر الآلية الذي تم ضبطه لالتقاط الكلمات المتوافقة مع خطاب الكراهية، ولكنه على ما يبدو لم يكن قادراً على استيعاب السياق.
وقد تعاونت الأستاذة المساعدة في جامعة كورنيل، بروك إرين دافي، مع طالب الدراسات العليا كولتين ميسنر، لإجراء مقابلات مع 30 منتجاً على منصات تيك توك وإنستغرام وتويتش ويوتيوب وتويتر، في نفس الفترة التي حقق فيها مقطع الفيديو الذي نشره تايلر انتشاراً واسعاً. وكان الهدف هو التعرف على أساليب المنتجين، خصوصاً المنتمين إلى شرائح مهمشة، في التعامل مع الخوارزميات وأساليب الرقابة للمنصات التي يستخدمونها.
وهذا ما وجدوه: يخصص المنتجون الكثير من الجهد في محاولة فهم الخوارزميات التي تتحكم بتجاربهم وعلاقاتهم على هذه المنصات. ونظراً لاستخدام الكثير من المنتجين عدة منصات، يجب أن يتعلموا القواعد الخفية لكل منصة منها. ويقوم بعض المنتجين بتعديل أساليبهم في إنتاج المحتوى والترويج له بالكامل للتكيف مع التحيزات الخوارزمية وتحيزات الرقابة التي يتعرضون لها.
للمزيد حول هذه الحرب الخفية، تابع قراءة المقالة على موقعنا عبر هذا الرابط
كيف يستفيد قطاع التأمين من الذكاء الاصطناعي؟
يعد قطاع التأمين بطبيعته قطاعاً محافظاً، حيث يميل إلى التأخر في تبني التكنولوجيا، ومن المحتمل أن يكون دخول الذكاء الاصطناعي ضمن بعض أكبر الشركات في قطاع التأمين دليلاً على نضج هذه التكنولوجيا والتقدم السريع الذي تحرزه.
تعد شركة تراكتابل (Tractable) مثالاً رئيسياً على هذا الاتجاه، وهي شركة مقرها المملكة المتحدة تستخدم الإبصار الحاسوبي لمساعدة شركات التأمين على تقييم الضرر الناجم باستخدام الصور. بدأت الشركة أعمالها في مجال التأمين على السيارات في أوروبا والآن في الولايات المتحدة، ويشمل عملاؤها شركات جيكو (Geico) وهارتفورد فايننشال (Hartford Financial) وغيرهما. كما بدأت في التوسع إلى التأمين على المنازل لمساعدة شركات التأمين على معالجة المطالبات بسرعة في أعقاب الكوارث الطبيعية، ثم انتقلت من التركيز فقط على تكنولوجيا الإبصار الحاسوبي إلى دمج معالجة اللغة الطبيعية بشكل متزايد لسحب المعلومات من المستندات.
ومن بين الشركات الأخرى التي تقوم بتطوير مثل هذه الأنظمة، شركة التأمين يو إس أيه أيه (USAA) التي عملت مع وحدة الحوسبة في منصة جوجل السحابية لتطوير نظام خاص بها مستند إلى الصور لتقدير الأضرار.
أعلنت شركة تراكتابل مؤخراً عن شراكة مع شركة أميركان فاميلي إنشورنس (American Family Insurance)، وهي واحدة من أكبر شركات التأمين على الممتلكات والحوادث في الولايات المتحدة، وتستخدم هذه الشركة نظام الذكاء الاصطناعي الخاص بشركة تراكتابل لتبسيط عملية تسمى الإنابة (أو الإحلال).
والإنابة هي الطريقة التي تحاول بها شركة تأمين ما استرداد أموال من شركة تأمين أخرى دفعتها مقابل مطالبة ما. ولتوضيح هذه الطريقة، لنفترض أن سائقاً ما تجاوز لافتة توقّف في أثناء القيادة واصطدم بسائق آخر صادف أنه كان مسرعاً أيضاً، كلتا السيارتين تضررتا بالحادث، ويطالب السائقان شركات التأمين الخاصة بهما بتعويض الضرر. تتفاوض بعد ذلك شركتا التأمين مع بعضهما لمحاولة استرداد بعض تكاليف المطالبة، وهذه هي الإنابة.
وشركة تراكتابل ليست الوحيدة التي تحاول استخدام الذكاء الاصطناعي في مجال الإنابة، حيث توفّر شركة رايفال كلير دوت أيه آي (Rival Klear.ai) منتجاً متخصصاً في الإنابة أيضاً، وتقدم الشركة عموماً مجموعة متنوعة من حلول الذكاء الاصطناعي لصناعة التأمين.
للمزيد حول هذا الموضوع، تابع قراءة المقالة على منصة فورتشن العربية عبر هذا الرابط
|