باحثون من جامعة الشارقة يطوّرون نماذج ذكاء اصطناعي لإدراج اللغة العربية ولهجاتها في معالجة اللغات الطبيعية

5 دقائق
باحثون من جامعة الشارقة يطوّرون نماذج ذكاء اصطناعي لإدراج اللغة العربية ولهجاتها في معالجة اللغات الطبيعية
حقوق الصورة: shutterstock.com/IR Stone
استمع الى المقالة الآن هذه الخدمة تجريبية
Play Audio Pause Audio

طورت مجموعة من الباحثين والمهندسين من جامعة الشارقة نظام تعلم عميق لاستخدام اللغة العربية ولهجاتها المختلفة في تطبيقات تتعلق بمعالجة اللغة الطبيعية (NLP)، وهي مجال فرعي متعدد التخصصات يجمع بين اللسانيات وعلم الحاسوب والذكاء الاصطناعي.

يقول العلماء إن مشروعهم سيضيف تحسينات كبيرة إلى أنظمة معالجة اللغة الطبيعية كي تصبح متوافقة مع اللغة العربية ولهجاتها عند برمجة الحواسيب؛ لإجراء عمليات المعالجة والتحليل على كميات ضخمة من بيانات اللغة الطبيعية، والمساعدة في تطوير برامج لتحسين المهارات المختلفة لتعلم اللغات وتعزيز دقة الترجمة.

تتضمن المجموعة عدداً من الأكاديميين والمهندسين، وقد أطلقت المشروع لتقييم مدى قابلية استخدام اللغة العربية والفائدة منها في تطبيقات الذكاء الاصطناعي لمساعدة ما يقرب من نصف مليار شخص ناطق باللغة العربية في العالم للاستفادة من التوجهات الحالية في تكنولوجيات الذكاء الاصطناعي. وقد نُشِرت نتائج عمل المجموعة في عدة مجلات علمية دولية محكمة.

قيود أنظمة معالجة اللغات الطبيعية

يعالج نظام الذكاء الاصطناعي الجديد الذي يصممه العلماء القيود التي تواجهها أنظمة معالجة اللغة الطبيعية عند معالجة لغات أخرى غير اللغة الإنجليزية. تتفاقم المشكلة مع اللغات الشبيهة باللغة العربية، التي تعجز الحواسيب عادة عن تفسير أشكال حروفها وكتابتها من اليمين إلى اليسار، والتي تختلف كثيراً عن اللغات المستندة إلى الأبجدية اللاتينية.

لمعالجة هذه المشكلة، قاد أستاذ علوم الحاسوب في جامعة الشارقة بالإمارات العربية المتحدة، الدكتور أشرف النجار، فريقاً من الأكاديميين لتطوير مجموعة من الأدوات الحاسوبية التي لا يقتصر عملها على مساعدة المبرمجين في كشف اللغة العربية القياسية وحسب، بل لهجاتها المتنوعة أيضاً. 

يقول د. النجار: “يمكن أن يؤدي إنجاز المشروع بنجاح إلى اعتماده على نطاق واسع من قبل الجمهور، حيث يوفر العديد من الفوائد والتحسينات لعدد من التطبيقات والخدمات اللغوية المعتمدة على الذكاء الاصطناعي”. ويضيف: “لدى المشروع القدرة على تلبية احتياجات مجموعة متنوعة من المستخدمين والمجالات، وتعزيز فعالية التواصل، وسهولة الوصول، وتوطين الجوانب اللغوية”. 

ولتوضيح النظام أكثر، يقول د. النجار إن النظام سيؤدي، عند إطلاقه، إلى تحسين الأداء وتجربة المستخدم للعديد من التطبيقات، مثل الترجمة الآلية، وتحليل العواطف، والتعرف على الكلام، وذلك للتعرف على اللغة العربية الفصحى بدقة، إضافة إلى لهجاتها المتعددة أيضاً، ما يسهم في الحفاظ على الثقافة، وسهولة الوصول، والتواصل الثقافي. 

اقرأ أيضاً: إضاءة على جهود باحثة في مجال المعالجة الحاسوبية للغة العربية

تعزيز مكانة اللغة العربية بمساعدة الذكاء الاصطناعي

لقد أصبح تعزيز مكانة اللغة العربية بمساعدة الذكاء الاصطناعي مسألة ملحة في بلدان الشرق الأوسط التي تتحدث اللغة العربية، حيث بدأ المستخدمون الخبراء في مجال الحاسوب يميلون إلى استخدام تشات جي بي تي وغيره من التطبيقات التي تعتمد على الذكاء الاصطناعي لتوليد المعلومات بسرعة، وتنفيذ مهام الكتابة، وتحسين المهارات اللغوية الأخرى.

يعتمد المشروع وفقاً للدكتور النجار على أبحاث الطلاب من المستوى الجامعي ومستوى الدراسات العليا. فقد نشأ المشروع في قسم علم الحاسوب في جامعة الشارقة، وهو يعبر عن الكفاءات المذهلة لطلابها ومدى استعدادهم للعمل وبذل الجهد المطلوب.و يشير إلى أن العمل بدأ على شكل مشروع لمجموعة من الطلاب الجامعيين في السنة الأخيرة، ولاحقاً، بادر طالب آخر إلى توسيع العمل، واستخدامه أساساً لأطروحته، مع التركيز على تحليل البيانات النصية. ومن المقرر لهذا المشروع أن يتعمق في مجال تحليل الملفات الصوتية. ويضيف: “نحن فخورون بشدة بطلابنا المدرَّبين داخل الجامعة، الذين طوروا هذا المشروع المهم والمؤثر بالكامل”. 

اقرأ أيضاً: معهد الابتكار التكنولوجي يطلق “نور”: نموذج الذكاء الاصطناعي القادر على معالجة اللغة العربية

إضافة اللغة العربية بلهجاتها إلى نُظم تشغيل بوتات الدردشة

سارع المطورون من لغات مختلفة إلى ركوب هذه الموجة الجديدة من الاهتمام، وحالياً، هناك الكثير من التطبيقات التي توفر التعديلات المخصصة الملائمة للغات التي ينطق بها هؤلاء المطورون. سيؤدي نظام الأستاذ النجار إلى سد ثغرة كانت بحاجة ملحّة إلى المعالجة، حيث سيضيف اللغة العربية، وهي اللغة السادسة على مستوى العالم من حيث عدد المتحدثين بها، لتكون نظام التشغيل الذي تعمل عليه تطبيقات بوتات الدردشة التي تعتمد على الذكاء الاصطناعي.

يبدي المطورون اهتماماً كبيراً للغاية بجعل أدوات الذكاء الاصطناعي المتعلقة بمعالجة اللغة الطبيعية قادرة على معالجة اللغة العربية ولهجاتها. لكن الدكتور النجار يقول إن نظام فريقه مختلف.

 ويقول: “ما يميز نظامنا عن غيره من نماذج الذكاء الاصطناعي للغة العربية هو تركيزه الخاص على كشف اللهجات العربية ومعالجتها. وعلى حين قد يعطي الكثير من النماذج الأولوية للغة العربية الفصحى المعاصرة أو اللهجات المحكية الشائعة، فإن نظامنا يشمل نطاقاً أوسع من اللهجات المختلفة، فقد طور طلابنا المتدربون في الجامعة التكنولوجيا التي يعتمد عليها هذا النظام، وتجمع هذه التكنولوجيا بين المنهجيات المتطورة وتقنيات التعلم العميق. إضافة إلى هذا، فإن المبادرة الرامية لتوسيع عمل هذه التكنولوجيا من النصوص إلى الإشارات الصوتية يجعلها أكثر تميزاً، حيث تقدم نهجاً متعدد الوسائط لفهم اللغة العربية ومعالجتها”.

اقرأ أيضاً: الباحثون يخوضون سباقاً لسبر أغوار العالَم المذهل والخطير لتقنيات معالجة اللغة

استخدم الفريق مجموعة ضخمة من بيانات اللهجات، تتميز بأنها متنوعة وخالية من التحيز، وذلك من خلال دمج عدة مجموعات بيانات مختلفة. بعد ذلك، عمد الفريق إلى تدريب عدة نماذج تقليدية ونماذج تعلم عميق، بما فيها أحدث أنواع نماذج التحويل، ونماذج التضمين وفق السياق مثل بيرت (BERT)، للتصنيف على أساس المنطقة وعلى أساس البلد. 

تستطيع هذه الأدوات تحسين أداء بوتات الدردشة، وذلك عن طريق كشف اللهجات العربية وفهمها بدقة، لتمكين بوتات الدردشة من تقديم إجابات أكثر توافقاً مع التفضيلات الشخصية وأكثر صلة بالمستخدم، وفقاً للنجار.

ومن الممكن حتى تخصيص هذه الأدوات كي تتوافق مع مناطق معينة وثقافات معينة ضمن عالم المتحدثين باللغة العربية. ما يتيح للشركات والخدمات العامة تلبية احتياجات جمهورها المُستهدف بصورة أفضل، ويضمن توافق المعلومات والخدمات المقدمة مع الجمهور المحلي، وفهمها بسهولة.

فوائد أخرى للنظام 

من النتائج المتوقعة للنظام أيضاً زيادة دقة الترجمة وزيادة فعاليتها من وإلى اللغة العربية، حيث سيوفر النظام درجة أعلى من الفهم للهجات العربية، وسيساعد أنظمة الترجمة الآلية على توفير ترجمات أدق، ما يزيد من سلاسة التواصل بين المتحدثين بلهجات أو لغات مختلفة. 

ستكون الشركات والمؤسسات على اختلافها من الأطراف المستفيدة من هذا النظام الجديد الذي يعتمد على الذكاء الاصطناعي، حيث سيساعدها على استخدام أدوات تحليل العواطف التي تأخذ اللهجات بعين الاعتبار، وذلك لفهم آراء جمهورها المستهدف وعواطفه على نحو أفضل، وفقاً للأستاذ النجار، حيث يمكن لهذا النظام أن يساعد الشركات والمؤسسات في تعديل استراتيجياتها التسويقية ومنتجاتها وخدماتها، لتصبح أكثر توافقاً مع الاحتياجات والتفضيلات الخاصة بالمناطق أو البلدان المختلفة.

وعند سؤال الأستاذ النجار عن مدى اهتمام أي جهات خارجية من أصحاب المصلحة بالبحث الذي يعمل عليه مع فريقه، أجاب: “نال المشروع درجة عالية من الاهتمام الخارجي، خصوصاً من شركات تكنولوجية كبرى مثل آي بي إم ومايكروسوفت”. إضافة إلى ذلك، فإن مؤسسة شراع المخصصة لدعم رواد الأعمال الجدد وتمكينهم في الشارقة، أبدت اهتمامها بالمشروع. وشارك ممثلون عن شراع في نقاشات حول احتمال تمويل تطوير منتج تجاري مبني على نتائج المشروع. 

اقرأ أيضاً: إطلاق العنان لقدرات الذكاء الاصطناعي التوليدي GenAI: بناء حلول مستقبلية مخصصة

يشير هذا المستوى من الاهتمام، من الشركات التكنولوجية العملاقة والهيئات الداعمة لريادة الأعمال، إلى القدرات الكامنة للمشروع، ليس بوصفه مبادرة بحثية وحسب، بل حلاً تجارياً يمكن استخدامه في نطاق واسع من التطبيقات المخصصة للأسواق.

أيضاً، يمكن لأدوات الذكاء الاصطناعي التي يعمل عليها العلماء أن تضمن مستوى أعلى من الوصول لذوي الهمم. يقول الأستاذ النجار: “ستتيح الأنظمة المصممة للتعرف على الكلام بلهجات معينة زيادة دقة التعرف على الأوامر الصوتية وخدمات تحويل الكلام إلى نصوص مكتوبة لذوي الهمم أو من يفضلون التواصل الصوتي”. 

لم يخلُ المشروع من التحديات، لكن الفريق تمكّن من مواجهتها بنجاح، وفقاً للأستاذ النجار. على سبيل المثال، ذكر الدكتور المشاكل المتعلقة بعدم وجود قواعد إملاء معيارية، وقلة الموارد، وقلة البيانات المصنفة، إضافة إلى ضخامة عدد اللهجات المختلفة باختلاف المناطق والثقافات الناطقة بالعربية.