جامعة محمد بن زايد تنال براءة اختراع عن نموذج ذكاء اصطناعي يحاكي خط اليد

3 دقيقة
جامعة محمد بن زايد تنال براءة اختراع عن نموذج ذكاء اصطناعي يحاكي خط اليد
حقوق الصورة: shutterstock.com/Pixels Hunter
استمع الى المقالة الآن هذه الخدمة تجريبية
Play Audio Pause Audio

طوّر فريقٌ من الباحثين في جامعة محمد بن زايد للذكاء الاصطناعي نموذج ذكاء اصطناعي يمكنه تعلم نمط الكتابة بخط اليد لشخصٍ ما وإنتاج نص مكتوب محاكٍ له، ونالوا عن هذا الابتكار براءة اختراع من “مكتب الولايات المتحدة لبراءات الاختراع والعلامات التجارية”.

نموذج ذكاء اصطناعي يحاكي الكتابة بخط اليد 

بدأ الباحثون من جامعة محمد بن زايد للذكاء الاصطناعي بتطوير نموذج ذكاء اصطناعي يحاكي كتابة خط اليد لمجرد الفضول العلمي، إذ يقول هشام شولاكال، الأستاذ المساعد بقسم الرؤية الحاسوبية في الجامعة وأحد المشاركين في تطوير هذه التكنولوجيا الجديدة: “أردنا فقط أن نعرف إذا ما كان بإمكاننا تغذية نموذج ذكاء اصطناعي بعينات مكتوبة بخط يد شخص، والنظر فيما إذا كان النموذج سيكون قادراً على التعرف على نمط خط يد ذلك الشخص ومن ثَمَّ كتابة أي شيء وفق النمط نفسه”.

قدّم الباحثون النتائج الأولية للبحث عام 2021، خلال أعمال المؤتمر الدولي للرؤية الحاسوبية، وقد ألقوا الضوء حينها على المقاربات السابقة التي حاولت محاكاة نمط الكتابة باليد التي طُوِّرت باستخدام تقنية التعلم الآلي المعروفة باسم “الشبكات التوليدية التنافسية“.

يحاكي هذا النوع من الشبكات نمط خط اليد، بما فيه محاكاة درجة ميلان الخط الذي يكتب به الشخص الحروف، أو درجة سُمك الخط؛ غير أن هذه التقنية تواجه صعوبة عندما يتعلق الأمر بمحاكاة نمط كتابة كل حرف والخطوط، وهو ما يُعرف باسم الحروف المركبة داخل كلمة، أو الخطوط التي تربط بين هذه الحروف.

لحل هذه المشكلة، استبدل الباحثون “مُحولات الرؤية” بالشبكات التوليدية التنافسية. ومحولات الرؤية نوع من الشبكات العصبونية الاصطناعية المصممة لمهام الرؤية الحاسوبية. وقد ركّز الباحثون في بحثهم على دراسة كيفية استخدام هذه المحولات لمحاكاة الكتابة باليد، خاصة وأنها تتمتع بقدرة أكبر على معالجة ما يُعرف بـ “التبعيات طويلة المدى”، ويشير هذا المفهوم إلى العناصر المُشكّلة للصورة وطريقة تباعدها عن بعضها بعضاً، والمعنى الذي تشكّله العلاقة بين هذه العناصر على الرغم من تباعدها.

اقرأ أيضاً: الذكاء الاصطناعي واللغة العربية: أهم التحديات وتقنيات معالجتها

ويوضّح د. فهد خان هذا الفرق أكثر قائلاً: “تتطلب محاكاة نمط كتابة خط اليد لشخصٍ ما النظر إلى النص المكتوب بأكمله حتى نتمكن من فهم طريقة الربط بين الحروف، أو بين أشكال الحروف، أو بين الكلمة وكلمة أخرى”. ويُتابع الدكتور شرحه قائلاً: “يتطلب رصد هذه العناصر كلها رؤية مجالية شاملة، وتحقيق هذا الهدف اعتماداً على الشبكات العصبونية الالتفافية ليس بالأمر السهل، وهذه كانت الفجوة التي اكتشفها فريقنا البحثي وعالجها اعتماداً على المحولات”.

ركّز الفريق أبحاثه الأولية على اللغة الإنجليزية، ويوجّه اهتمامه الآن على توليد كتابة خط اليد باللغة العربية التي تشتهر بصعوبة تحليلها بسبب طريقة ارتباط الحروف العربية في نص مكتوب بخط اليد.

التقنية تنال تفضيل الكثيرين على مثيلاتها

أطلق الفريق على التقنية التي ابتكرها اسم محوّل الكتابة اليدوية (HWT)، ولمعرفة مدى تقبل الأشخاص لها، عرضوا على 100 شخص نصوصاً مولّدة عن طريقها، بالإضافة إلى تقنيتين هما “جي إيه إن رايتينج” (GANwriting) وتقنية “دافيس وزملائه” (Davis et al)، وطلبوا من المشاركين اختيار النموذج الذي يفضّلونه في الكتابة. أظهرت النتائج أن المشاركين في الدراسة فضّلوا محول الكتابة اليدوية (HWT) على مولدات النصوص المكتوبة بخط اليد الأخرى بنسبة 81%.

يُذكر أن الباحثين أعطوا الأمر للنماذج الثلاثة بتوليد النصوص ذاتها، كما دُرِّبت على العينات ذاتها والمكونة من نصوص مختلفة كتبها 6 أشخاص مختلفين. أثبت النموذج الخاص بهم أنه الأفضل في محاكاة نمط كتابة خط اليد في شكله العام وفي تفاصيله ما يؤدي إلى توليد كتابة خط يد أكثر واقعية. ويقول الدكتور سلمان خان الأستاذ المشارك في الرؤية الحاسوبية ونائب رئيس قسم الرؤية الحاسوبية: “إن الكتابة اليدوية التي أنشئت كانت جيدة جداً إلى درجة أن المشاركين في هذه التجربة لم يتمكنوا من التمييز بين خط اليد المقلّد وخط اليد الفعلي، وكان من المُرضي رؤية هذه النتيجة”.

اقرأ أيضاً: جوجل تطوّر أداة تقرأ خط الأطباء المبهم للوصفات الطبية

أضرار ومنافع في وقتٍ واحد 

لا يتطلب النموذج الكثير من البيانات للتدريب، إذ تكفي بضع فقرات أصلية مكتوبة بخط اليد المراد محاكاته فقط، وهو ما قد يشكّل خطورة تتمثل في “إساءة استخدام هذه التقنية التي تحاكي جزءاً من هوية الشخص ألا وهي كتابة خط اليد، وهذا أمر نأخذه على محمل الجد ونفكر فيه ملياً قبل الإقدم على خطوة نشر استعمال هذه التقنية”، وذلك على حد قول الدكتور راو محمد أنور، الأستاذ المساعد في قسم الرؤية الحاسوبية.

على الرغم من هذه المخاطر، يقول الباحثون إن النتائج التي توصلوا إليها تعزز الوعي بالتهديدات المحتملة، إذ إنه من المهم إدراك أن استخدام الذكاء الاصطناعي لتوليد خط يحاكي نمط خط يد الإنسان هو أمر ممكن.

اقرأ أيضاً: هل يشكّل تشات جي بي تي خطراً وجودياً على موسوعة ويكيبيديا؟

بينما تكمن الفائدة من هذا الابتكار في مساعدة الأشخاص الذين يعانون إصابات تمنعهم من استخدام القلم، كما يمكن استخدامه بكفاءة لتوليد كمية كبيرة من البيانات لتحسين قدرة نماذج التعلم الآلي على معالجة النصوص المكتوبة بخط اليد.