أداة تنبه الكتّاب عند استخدام أعمالهم في تدريب الذكاء الاصطناعي

منذ بداية ازدهار الذكاء الاصطناعي التوليدي، قال صانعو المحتوى إن أعمالهم تعرضت للاستغلال حيث تقتبس منها نماذج الذكاء الاصطناعي دون موافقتهم. إلا أنه حتى الآن، ما زال من الصعب أن نجزم باستخدام نص محدد فعلياً في إحدى مجموعات البيانات التدريبية.

لكن ثمة وسيلة جديدة لإثبات هذه المسألة الآن، وهي "فخاخ حقوق التأليف والنشر" (copyright traps) التي طورها فريق في كلية إمبيريال كوليدج لندن، وهي مقاطع من النصوص المخفية التي تتيح للكتاب والناشرين وضع علامات خفية في أعمالهم حتى يصبح من الممكن لاحقاً معرفة إن كانت جزءاً من البيانات المستخدمة في تدريب نماذج الذكاء الاصطناعي أم لا. هذه الفكرة مماثلة للفخاخ التي استخدمها أصحاب حقوق التأليف والنشر عبر التاريخ، وهي استراتيجيات تعتمد على أساليب مثل وضع مواقع مزيفة على خريطة، أو كلمات مزيفة في قاموس.

كيف سيتم استخدام فخاخ حقوق التأليف والنشر؟

ستصبح فخاخ حقوق التأليف والنشر الخاصة بالذكاء الاصطناعي هذه جزءاً من أكبر النزاعات في مجال الذكاء الاصطناعي. فثمة عدد من الناشرين والكتّاب الذين يخوضون معارك قانونية مع عدد من الشركات التكنولوجية، حيث يزعمون أن ملكياتهم الفكرية أصبحت جزءاً من مجموعات البيانات المستخدمة في تدريب أنظمة الذكاء الاصطناعي، وذلك دون موافقتهم. ومن المرجح أن أشهرها هي الدعوى القضائية التي رفعتها صحيفة نيويورك تايمز (New York Times) ضد أوبن أيه آي (OpenAI)، والتي ما زالت مستمرة حتى الآن.

إن الرموز البرمجية اللازمة لتوليد هذه الفخاخ وكشفها متوفرة حالياً على منصة غيت هاب (GitHub)، لكن الفريق ينوي أيضاً بناء أداة تسمح للأشخاص بتوليد فخاخ حقوق التأليف والنشر بأنفسهم ودسها.

يقول الأستاذ المساعد المختص بالرياضيات التطبيقية وعلوم الكمبيوتر في كلية إمبيريال كوليدج لندن، إيف ألكسندر دو مونتجوي، الذي قاد المشروع البحثي: "ثمة نقص كامل في الشفافية من حيث المحتوى المستخدم في تدريب النماذج، ونحن نعتقد أن هذا يمنع إيجاد التوازن الصحيح بين شركات الذكاء الاصطناعي وصانعي المحتوى". ظهر البحث مؤخراً في المؤتمر الدولي للتعلم الآلي، وهو مؤتمر رفيع المستوى حول الذكاء الاصطناعي استضافته العاصمة النمساوية، فيينا.

استخدم الفريق، بهدف إنشاء الفخاخ، مولد كلمات لإنشاء الآلاف من الجمل الاصطناعية. هذه الجمل طويلة ومليئة بالهراء، وقد تبدو على شاكلة المقطع التالي: "عندما تحين الأوقات العصيبة، فإن السلع المشمولة بالحسومات، والأهم من ذلك عندما -هي الأفضل- تطلعك هذه القائمة على المتاجر التي تفتح أبوابها يوم الخميس في الليل مع الأوقات العادية المخصصة للبيع، وأوقات العمل الأخرى من جيرانك. أنت ما تزال" (When in comes times of turmoil … whats on sale and more important when, is best, this list tells your who is opening on Thrs. at night with their regular sale times and other opening time from your neighbors. You still.)

جمل متصيدة

ولد الفريق 100 جملة "متصيدة"، ثم اختاروا عشوائياً جملة منها لدسها ضمن نص معين مرات عديدة، كما يشرح لنا دو مونتجوي. يمكن دس الفخ في النص بطرق متعددة، وعلى سبيل المثال، يمكن وضعه على شكل نص مكتوب باللون الأبيض على خلفية بيضاء، أو دمجه ضمن الشيفرة المصدرية للمقال. كان على الباحثين أن يكرروا هذه الجملة في النص مرات تراوحت من 100 مرة إلى 1000 مرة.

ولكشف هذه الفخاخ، لقموا نموذجاً لغوياً كبيراً بالجمل الاصطناعية المائة التي ولدوها، وتحققوا إن كان النموذج قد كشف هذه الجمل على أنها جديدة أم لا. فإذا صادف النموذج جملة متصيدة ضمن بياناته التدريبية، سيشير إلى ذلك بتسجيل درجة "تفاجؤ" (surprise) منخفضة (وهي معروفة أيضاً باسم "اندهاش" [perplexity]). لكن إذا تبين أن النموذج "مندهش" بسبب هذه الجمل، فهذا يعني أنه يصادفها للمرة الأولى، ما يعني أنها ليست فخاخاً.

في الماضي، اقترح الباحثون استثمار قدرة النماذج اللغوية على تذكر بيانات التدريب الخاصة بها، لتحديد وجود شيء ما في هذه البيانات. تحمل هذه التقنية اسم "هجوم استنباط العضوية" (membership inference attack)، وهي تعمل بصورة فعالة على أحدث النماذج الكبيرة، التي تميل إلى حفظ الكثير من بياناتها خلال التدريب.

في المقابل، فإن النماذج الأصغر حجماً، التي بدأت تحقق شعبية واسعة، والتي يمكن أن تعمل على الأجهزة المحمولة، تحفظ كميات أقل من البيانات، ولهذا فإنها أقل عرضة للتأثر بهجمات استنباط العضوية، ما يزيد صعوبة تحديد وجود مستند معين خاضع لحقوق التأليف والنشر ضمن بياناتها التدريبية، كما يقول الأستاذ المساعد المختص بعلوم الكمبيوتر في جامعة واترلو، غوتام كاماث، الذي لم يشارك في البحث.

تطبيق هجمات استنباط العضوية

تمثل فخاخ حقوق التأليف والنشر وسيلة تتيح تطبيق هجمات استنباط العضوية حتى على النماذج الأصغر. فقد دس باحثو الفريق فخاخهم في مجموعة البيانات التدريبية لنموذج كرواسان إل إل إم (CroissantLLM)، وهو نموذج لغوي جديد مزدوج اللغة (الإنجليزية والفرنسية)، تدرب من الصفر، حيث تولى تدريبه فريق يضم باحثين يعملون في شركات تكنولوجية وباحثين أكاديميين، وهو الفريق الذي تعاون معه فريق كلية إمبيريال كوليدج لندن. يتضمن كرواسان إل إل إم 1.3 مليار مُعامل، وهو عدد صغير من المُعاملات مقارنة بما لدى أحدث النماذج (على سبيل المثال، تشير التقارير إلى أن جي بي تي 4 [GPT-4] يتضمن 1.76 تريليون معامل).

يُظهر البحث أنه من الممكن بالفعل وضع فخاخ كهذه ضمن البيانات النصية لزيادة فعالية هجمات استنباط العضوية إلى حد كبير، حتى بالنسبة إلى النماذج الأصغر، على حد قول كاماث. ويضيف قائلاً إنه ما زال هناك الكثير مما يجب فعله،

فتكرار جملة مكونة من 75 كلمة 1000 مرة في مستند نصي يؤدي إلى إحداث تغيير كبير في النص الأصلي، ما قد يتيح للأشخاص الذين يدربون نماذج الذكاء الاصطناعي كشف الفخ وتجاوز المحتوى الذي يتضمنه، أو حذفه ببساطة وتدريبه على ما تبقى من النص، على حد قول كاماث، كما قد يؤدي هذا إلى زيادة صعوبة قراءة النص الأصلي.

هذه المشاكل تجعل فخاخ حقوق التأليف والنشر غير عملية في الوقت الحالي، كما يقول أستاذ علوم الكمبيوتر في جامعة كاليفورنيا بمدينة إرفاين، سمير سينغ، وهو أحد مؤسسي الشركة الناشئة سبيفي أيه آي (Spiffy AI) الذي لم يشارك في العمل. يقول سينغ: "يلجأ الكثير من الشركات إلى عملية إزالة التكرار، ما يعني أنها تنظف البيانات، ولهذا فإن نسبة كبيرة من هذه الجمل ستتعرض في نهاية المطاف إلى الحذف".

كيف يمكن تحسين فخاخ حقوق التأليف والنشر؟

يقول كاماث إن أحد أساليب تحسين فخاخ حقوق التأليف والنشر، هو إيجاد طرق أخرى لوضع علامات على المحتوى المحمي بموجب حقوق التأليف والنشر لتحسين فعالية هجمات استنباط العضوية عليها، أو لتحسين هجمات استنباط العضوية نفسها.

يعترف دو مونتجوي بأن الفخاخ ليست مضمونة النتائج، ويقول إن المهاجم العنيد الذي يعرف بوجود الفخاخ، قد يزيلها.

يقول دو مونتجوي: "إن إمكانية إزالة الفخاخ كلها أم لا تمثل سؤالاً مفتوحاً، ومن المرجح أن يتحول الأمر إلى ما يشبه لعبة القط والفأر". لكن حتى في هذه الحالة، فإن استخدام المزيد من الفخاخ سيزيد صعوبة إزالتها جميعاً دون الاعتماد على موارد هندسية كبيرة.

يقول كاماث: "من المهم أن نأخذ في الاعتبار أن فخاخ حقوق التأليف والنشر قد تكون مجرد حل مؤقت، أو مجرد إزعاج بالنسبة إلى مدربي النماذج. وإذا نشر المرء محتوى يتضمن فخاً، فلا شيء يضمن له أن يبقى فخاً فعالاً إلى الأبد".