هل يمكن للعلامات المائية أن تكشف النصوص التي ألفتها بوتات الدردشة؟

يمكن للأنماط المخفية في النصوص التي ولدها الذكاء الاصطناعي أن تساعد في كشف حقيقتها، ما يتيح لنا تمييز النصوص التي كتبها الذكاء الاصطناعي عن تلك التي كتبها البشر.

وهذه "العلامات المائية" غير مرئية للعين المجردة، ولكنها تتيح للحواسيب كشف النصوص التي يُرجّح أنها صادرة عن نظام ذكاء اصطناعي. وإذا تم إدماج هذه العلامات في النماذج اللغوية الكبيرة، فمن الممكن أن تساعد في منع بعض المشكلات التي تسببت بها هذه النماذج.

وسيلة واعدة لكشف النصوص المولدة بالذكاء الاصطناعي

على سبيل المثال، ومنذ إطلاق بوت الدردشة تشات جي بي تي (ChatGPT) من قِبل شركة أوبن أيه آي (OpenAI) في نوفمبر/ تشرين الثاني الماضي، بدأ الطلبة يستخدمونه للغش بجعله يكتب المقالات المطلوبة منهم في الدراسة. وقد استخدم موقع الأخبار سي نيت (CNET) تشات جي بي تي لكتابة المقالات، واضطر بعدها إلى نشر عدة تصحيحات وسط اتهامات وُجهت له بالسرقة الأدبية. ولكن هناك وسيلة واعدة لكشف النصوص التي كتبها الذكاء الاصطناعي، وتتلخص بإدماج أنماط خفية في هذه الأنظمة بحيث تتيح لنا تحديد النصوص التي كتبها الذكاء الاصطناعي قبل نشرها.

وفي بعض الدراسات، تبين أن هذه العلامات المائية تستطيع كشف النصوص التي كتبها الذكاء الاصطناعي بدقة شبه كاملة. وقد تمكن فريق من جامعة ماريلاند من تطوير إحدى العلامات، وتمكن من كشف نص تم توليده باستخدام النموذج اللغوي مفتوح المصدر "OPT-6.7B" من شركة ميتا (Meta) بالاعتماد على خوارزمية طورها الفريق. وتم توصيف العمل في ورقة بحثية لم تخضع بعد للمراجعة النقدية، كما سيتم نشر التعليمات البرمجية للعموم مجاناً في 15 فبراير/ شباط تقريباً.

كيف تعمل خوارزمية العلامة المائية؟

تعمل نماذج الذكاء الاصطناعي اللغوية عن طريق توقع الكلمات وتوليدها واحدة تلو الأخرى. وبعد كل كلمة، تقوم خوارزمية العلامة المائية بتوزيع مفردات النموذج اللغوي عشوائياً على قائمتين: "قائمة خضراء" و"قائمة حمراء"، ومن ثم تطلب من النموذج اللغوي اختيار كلمات من القائمة الخضراء.

وكلما زاد عدد الكلمات الخضراء في المقطع، زاد احتمال كونه من تأليف نظام آلي. تميل النصوص التي يؤلفها البشر إلى درجة أكبر من العشوائية في الكلمات. وعلى سبيل المثال، عند ورود صفة "جميلة" (الصفة ترد قبل الموصوف في اللغة الإنجليزية)، يمكن لخوارزمية العلامة المائية أن تصنف كلمة "زهرة" (التي تلي كلمة "جميلة") ككلمة خضراء، و"أوركيد" ككلمة حمراء. فنموذج الذكاء الاصطناعي المزود بخوارزمية علامة مائية سيستخدم كلمة "زهرة" باحتمال أكبر من استخدامه لكلمة "أوركيد"، كما يشرح الأستاذ المساعد في جامعة ميريلاند، توم غولدستين، والذي شارك في البحث.

سباق متواصل بين مطوري الذكاء الاصطناعي لبناء أدوات الحماية

ينتمي تشات جي بي تي إلى جيل جديد من النماذج اللغوية الكبيرة التي تستطيع توليد نصوص انسيابية الصياغة، وتبدو من تأليف البشر. وتقوم هذه النماذج اللغوية بتعداد الحقائق بطابع ينم عن الثقة، ولكنها معروفة بأنها تنتج في الواقع الكثير من المعلومات الخاطئة والصياغات المتحيزة. وبالنسبة لغير الخبراء، يكاد يكون من المستحيل التمييز بين مقطع كتبه نموذج ذكاء اصطناعي ومقطع كتبه البشر.

إن السرعة الهائلة لتطور أنظمة الذكاء الاصطناعي تعني أن النماذج الجديدة، والتي تتمتع بقدرات أكبر، ستجعل مجموعة الأدوات التي بين أيدينا حالياً لكشف النصوص الاصطناعية أقل فعالية. إنه سباق متواصل بين مطوري الذكاء الاصطناعي لبناء أدوات حماية جديدة تستطيع مجاراة أحدث أجيال نماذج الذكاء الاصطناعي اللغوية.

يقول الباحث في جامعة ميريلاند، جون كيرشنباور، والذي شارك في بحث العلامة المائية: "إن الوضع الحالي أشبه ما يكون بالغرب الأميركي القديم". ويأمل بأن أدوات العلامة المائية ستعطي الأفضلية لجهود كشف نصوص الذكاء الاصطناعي. ويمكن تعديل هذه الأداة التي طوّرها الفريق حتى تكون متوافقة مع أي نموذج لغوي يتنبأ بالكلمة التالية، على حد قوله.

تقول مديرة السياسات في شركة الذكاء الاصطناعي الناشئة هاغينغ فيس (Hugging Face)، آيرين سليمان، والتي عملت على دراسة كشف مخرجات الذكاء الاصطناعي في منصبها السابق كباحثة ذكاء اصطناعي في أوبن أيه آي، ولم تشارك في هذا البحث، إن النتائج واعدة وتم التوصل إليها في الوقت المناسب.

وتقول: "مع بدء استخدام النماذج على نطاق واسع، ستصبح وسائل الكشف ضرورية بالنسبة لعدد أكبر من الناس خارج أوساط الذكاء الاصطناعي، والذين لم يحظوا على الأرجح بأي تأهيل في مجال علوم الحاسوب".

ما أوجه قصور الطريقة الجديدة المعتمدة على العلامة المائية؟

بيد أنه ثمة قصور في هذه الطريقة الجديدة. فطريقة العلامات المائية يمكن أن تنجح فقط في حال إدماجها في النموذج اللغوي من قبل مصمميه منذ البداية. وعلى الرغم من أن أوبن أيه آي، كما يقال، تعمل على وضع طرق لكشف النصوص التي ألّفها الذكاء الاصطناعي، بما في ذلك العلامات المائية، فإنها تحيط عملها هذا بسرية تامة حتى الآن. ولا تميل الشركة إلى تقديم أي معلومات لأي أطراف خارجية حول كيفية عمل تشات جي بي تي أو تدريبه، ناهيك عن تعديله. ولم تستجب أوبن أيه آي على الفور لطلبنا بإدلاء تعليق.

كما أنه ليس من الواضح كيف يمكن تطبيق هذه الطريقة على نماذج أخرى غير نموذج ميتا، مثل تشات جي بي تي، كما تقول سليمان. إضافة إلى هذا، فإن نموذج الذكاء الاصطناعي الذي تم اختبار العلامة المائية عليه كان أصغر من النماذج المعروفة، مثل تشات جي بي تي.

ويقول الباحثون إن خيارات مواجهة أساليب العلامات المائية محدودة. يقول غولدستين: "تتطلب إزالة العلامة المائية من النص تغيير نصف الكلمات فيه تقريباً". ولكن، ثمة حاجة إلى إجراء المزيد من الاختبارات لدراسة عدة طرق مختلفة يمكن للمهاجمين اللجوء إليها في محاولة لإزالة العلامة المائية.

تقول سليمان: "ليس الاستخفاف بطلبة المرحلة الثانوية من الحكمة في شيء، وبالتالي لن أقوم بهذا أيضاً، ولكن الشخص العادي، بشكل عام، لن يكون على الأرجح قادراً على التلاعب بعلامة مائية من هذا النوع".