تتضمن قاعدة البيانات 3,000 مقطع فيديو قام الذكاء الاصطناعي بتوليدها باستخدام عدة خوارزميات متاحة للعموم.
خلفية الخبر
خلال العام الماضي، أصبحت الخوارزميات التوليدية قادرة على تركيب محتوى الوسائط بشكل متقن إلى حد أنها قد تصل قريباً إلى درجة يستحيل معها تمييزها عن الواقع. ويعمل الخبراء الآن بأقصى سرعتهم للعثور على وسائل أفضل لكشف هذه المواد، التي تحمل اسم المُزَيَّفات العميقة، خصوصاً مع اقتراب الانتخابات الرئاسية الأميركية في 2020.
كمية من المُزيَّفات العميقة
قامت جوجل مؤخراً بإطلاق قاعدة بيانات مفتوحة المصدر تحتوي على 3,000 فيديو مزيف جديد في إطار جهودها لتسريع تطوير أدوات كشف التزييف العميق. وقد عملت مع 28 ممثلاً لتسجيل فيديوهات لهم وهم يتكلمون ويغيرون من تعابير وجوههم ويقومون بمهام اعتيادية.
أحدث ما توصل إليه العلم
أعلنت فيسبوك منذ فترة قريبة أنها ستطلق قاعدة بيانات مماثلة مع اقتراب نهاية السنة. وفي يناير الماضي، قام فريق أكاديمي بقيادة باحث من جامعة ميونخ التكنولوجية ببناء قاعدة بيانات تسمى فيس فورينزيكس بلس بلس عن طريق تطبيق 4 أدوات شائعة للتلاعب بالوجوه على نحو 1,000 مقطع فيديو من يوتيوب. وتقوم كل من قواعد البيانات هذه على نفس الفكرة: بناء مجموعة كبيرة من الأمثلة التي يمكن أن تساعد في تدريب واختبار أدوات الكشف الآلية.
لعبة القط والفأر
ولكن ما إن يتم تطوير طريقة كشف جديدة عن طريق استغلال خطأ ما في إحدى خوارزميات التوليد، فإنه يمكن تعديل الخوارزمية بسهولة لتصحيح هذا الخطأ؛ ولهذا يحاول بعض الخبراء الآن إيجاد طرائق كشف مع افتراض خلوّ الصور المصطنعة من الأخطاء. ويقول آخرون إن من المستحيل أن نسيطر على التزييف العميق بالأساليب التكنولوجية وحدها، بل سيتطلب الأمر إيجاد حلول اجتماعية وسياسية وقانونية للتعامل مع الحوافز التي تشجع على تركيب محتوى هذه المزيفات في المقام الأول.