ما هي تقنية ميتا الجديدة لإضافة العلامات المائية إلى كلام الذكاء الاصطناعي؟

بنت شركة ميتا (Meta) نظاماً يمكنه تضمين إشارات خفية، تُعرف باسم العلامات المائية، في المقاطع الصوتية التي يولدها الذكاء الاصطناعي، ما يمكن أن يساعد في كشف المحتوى المولّد باستخدام الذكاء الاصطناعي على الإنترنت.

"أوديوسيل" (AudioSeal): أداة لمكافحة المزيفات الصوتية العميقة

تحمل الأداة اسم "أوديوسيل" (AudioSeal)، وهي الأداة الأولى التي تستطيع أن تحدد الأجزاء الصوتية التي يُحتمل أنها مُوَلدة باستخدام الذكاء الاصطناعي ضمن مدونة صوتية يبلغ طولها ساعة كاملة، على سبيل المثال. ويقول الباحث العلمي في ميتا، هادي السحار، إنها يمكن أن تساعد في مواجهة مشكلة متنامية تتمثل باستخدام أدوات استنساخ الصوت في المعلومات المزيفة وعمليات الاحتيال. ثمة جهات فاعلة خبيثة استخدمت الذكاء الاصطناعي التوليدي في إنتاج مزيفات عميقة صوتية للرئيس جو بايدن، كما لجأ المحتالون إلى استخدام المزيفات العميقة في ابتزاز ضحاياهم. نظرياً، يمكن أن تساعد العلامات المائية شركات وسائل التواصل الاجتماعي في كشف المحتوى غير المرغوب فيه وإزالته.

لكن ثمة بعض المحاذير الكبيرة التي يجب أن تؤخذ بعين الاعتبار. تقول ميتا إنها لم تخطط بعد لتطبيق العلامات المائية على مقاطع الصوت المُوَلدة باستخدام أدواتها التي تعتمد على الذكاء الاصطناعي. لم يجر اعتماد العلامات المائية الصوتية على نطاق واسع حتى الآن، ولا يوجد أي معيار موحد ومتفق عليه في هذا المجال لتنظيمها. إضافة إلى ذلك، فإن العلامات المائية للمحتوى المُوَلد باستخدام الذكاء الاصطناعي تميل إلى أن تكون قابلة للتلاعب بها بسهولة، وذلك من خلال إزالتها أو تزييفها على سبيل المثال.

يقول السحار إن سرعة الكشف والقدرة على تحديد العناصر المُوَلدة باستخدام الذكاء الاصطناعي في الملف الصوتي سيكونان عنصرين حاسمين في جعل هذه الأنظمة مفيدة. ويقول إن الفريق تمكن من تحقيق دقة تتراوح بين 90% و100% في كشف العلامات المائية، وهي نتائج أفضل بكثير من المحاولات السابقة لإضافة العلامات المائية إلى الملفات الصوتية.

أوديوسيل متاحة عبر منصة غيت هاب (GitHub) مجاناً. ويمكن لأي شخص أن ينزلها ويستخدمها لإضافة العلامات المائية إلى المقاطع الصوتية المُوَلدة باستخدام الذكاء الاصطناعي. ومن الممكن أن تضاف في نهاية المطاف إلى نماذج توليد الصوت التي تعمل بالذكاء الاصطناعي، بحيث يجري تطبيق العلامات المائية آلياً على أي خطاب مُوَلد باستخدام هذه النماذج. سيقدم الباحثون الذين صمموا هذا النظام عملهم في المؤتمر الدولي حول التعلم الآلي (International Conference on Machine Learning) الذي سيُعقد في شهر يوليو/تموز بالعاصمة النمساوية فيينا.

تضمين علامة مائية في كل مقطع من المسار الصوتي

طور الباحثون أوديوسيل باستخدام شبكتين عصبونيتين. حيث تولد الأولى إشارات العلامات المائية التي يمكن دمجها في المسارات الصوتية. هذه الإشارات غير محسوسة بالنسبة إلى الأذن البشرية، لكن يمكن كشفها بسرعة من خلال الشبكة العصبونية الأخرى. حالياً، إذا أردت أن تحاول كشف الأصوات المُوَلدة باستخدام الذكاء الاصطناعي ضمن مقطع أطول، يجب أن تتفحص المقطع بأكمله من خلال تقسيمه إلى مقاطع جزئية يبلغ طول كل منها ثانية واحدة، لمعرفة إن كان أي منها يحتوي على علامة مائية. هذه عملية بطيئة ومضنية، وليست قابلة للتطبيق بالنسبة إلى منصات التواصل الاجتماعي التي تتضمن ملايين الدقائق من المقاطع الصوتية الكلامية.

تعمل أوديوسيل بطريقة مختلفة، من خلال تضمين علامة مائية في كل مقطع من المسار الصوتي بأسره. وهو ما يتيح للعلامة المائية أن تصبح "موضعية"، ما يعني إمكانية كشفها حتى بعد تقطيع المقطع الصوتي أو تعديله.

يقول أستاذ علوم الكمبيوتر في جامعة شيكاغو، بن زاو، إن هذه القدرة، إضافة إلى دقة الكشف التي تكاد تكون مثالية، تجعلان أوديوسيل أفضل من أي نظام علامات مائية صوتية رآه حتى الآن.

اقرأ أيضاً: هل إضافة العلامات المائية إلى صور الذكاء الاصطناعي مجدية في محاربة التزييف؟

الأداة الأفضل حتى الآن

وتقول رئيسة قسم نزاهة الذكاء الاصطناعي والوسائط في المؤسسة اللاربحية بارتنرشيب أون أيه آي (Partnership on AI)، كلير ليباويتش: "من المفيد استكشاف الأبحاث التي تهدف إلى تحسين تقنيات العلامات المائية الحديثة، لا سيما في وسائط مثل الكلام، حيث تصبح عملية وضع العلامات المائية وكشفها في أغلب الأحيان أصعب مما هي عليه في المحتوى المرئي".

لكن ثمة بعض العيوب الرئيسية التي يجب التغلب عليها قبل أن تصبح هذه العلامات المائية الصوتية صالحة للاستخدام على نطاق واسع. اختبر باحثو ميتا أساليب هجوم مختلفة لإزالة العلامات المائية، ووجدوا أن خوارزمية العلامة المائية تصبح أكثر عرضة للخطر مع زيادة المعلومات التي تُكشف عنها. أيضاً، يتطلب النظام من المستخدمين إضافة العلامة المائية طوعاً إلى ملفاتهم الصوتية.

وهو ما يؤدي إلى فرض بعض القيود الأساسية على الأداة، على حد قول زاو. ويضيف قائلاً: "عندما يتمكن المهاجم من الوصول إلى كاشف العلامة المائية، يصبح النظام ضعيفاً للغاية". وهو ما يعني أن إمكانية كشف محتوى الصوت المُوَلد بالذكاء الاصطناعي ستكون محصورة بشركة ميتا فقط.

تقول ليباويتش إنها ما زالت مقتنعة بأن العلامات المائية ستنجح فعلياً في تعزيز ثقة العامة بالمعلومات التي يرونها أو يسمعونها، على الرغم من انتشارها الواسع في قطاع التكنولوجيا بوصفها حلاً لهذه المشكلة. يرجع ذلك جزئياً إلى أن العلامات المائية نفسها معرضة بشدة لإساءة الاستخدام.

وتضيف قائلة: "لدي شكوك في قدرة أي علامة مائية على مقاومة المحاولات الخبيثة للإزالة والتزييف".