باحثون يستخدمون التعلّم الآلي لترجمة اللغات المندثرة منذ زمن طویل

4 دقائق
دون لويد | فليكر
استمع الى المقالة الآن هذه الخدمة تجريبية
Play Audio Pause Audio

في عام 1886، صادف عالم الآثار البریطاني آرثر إیفانز حجراً قدیماً علیه مجموعة غریبة من النقوش المكتوبة بلغة غیر معروفة. جاء الحجر من جزیرة في البحر الأبیض المتوسط، وسافر إیفانز إلى ھناك على الفور للبحث عن المزید من الأدلة. وسرعان ما عثر على العدید من الأحجار والألواح التي تحمل نقوشاً مشابھة، وقدّر أن تاریخھا یعود إلى حوالي 1400 سنة قبل المیلاد.

وهذا ما یجعل تلك النقوش أحد أقدم أشكال الكتابة التي تم اكتشافھا على الإطلاق. وقد قال إیفانز بأن شكلھا الخطي مستمد بوضوح من الصور الخطیة المنقوشة بشكل غلیظ، التي تنتمي إلى عھد بدایة الفن، وبالتالي فھذا إثبات لأھمیتھا في تاریخ اللغویات.

قرّر إیفانز وآخرون في وقت لاحق أن الأحجار والألواح كانت مكتوبة بنظامین لغویین مختلفین. ویرجع تاریخ النظام الأقدم الذي یسمى النظام الخطي (أ) إلى ما بین عامي 1800 و1400 قبل المیلاد، عندما كانت الجزیرة تحت سیطرة الحضارة المینویة في العصر البرونزي.

أما النظام الآخر الذي یسمى النظام الخطي (ب) فھو أحدث، ولم یظھر إلا بعد عام 1400 قبل المیلاد، عندما تم احتلال الجزیرة من قبل الموكنایین القادمین من الیونان.

وقد حاول إیفانز وغیره لسنوات عدیدة فك رموز الكتابات القدیمة، ولكن ھذه اللغات المندثرة كانت عصیّة على كل المحاولات. وظلت المشكلة دون حل حتى عام 1953، عندما قام العالم اللغوي الھاوي مایكل فنتریس بفك رموز النظام الخطي (ب).

قام فنتریس بتقدیم الحلّ اعتماداً على اثنین من الاكتشافات الحاسمة. أولاً، خمّن فنتریس أن العدید من الكلمات المتكررة في النظام الخطي (ب) كانت أسماء لأماكن في جزیرة كریت. واتضح أن ذلك صحیح.

وكان اكتشافه الثاني ھو افتراضه أن ھذه الكتابة شكّلت نمطاً أولیاً من اللغة الیونانیة القدیمة. سمحت له تلك الفكرة فوراً بفك رموز ما تبقى من اللغة. وخلال ھذه العملیة، أظھر فنتریس أن اللغة الیونانیة القدیمة ظھرت على شكل كتابة لأول مرة في وقت أبكر بعدة قرون مما كان یعتقد سابقاً.

كان عمل فنتریس إنجازاً كبیراً، ولكن النظام الخطي (أ) الأقدم ظلّ أحد أكبر المشاكل البارزة في مجال اللغویات حتى یومنا ھذا.

ولیس من الصعب أن نتخیّل أن التطورات الحدیثة في الترجمة الآلیة قد تساعد في ذلك. ففي بضع سنوات فقط، حدثت ثورة في دراسة اللغویات من خلال توفر قواعد بیانات مترجمة ضخمة وتقنیات لجعل الآلات تتعلّم منھا. وبالتالي، أصبحت الترجمة الآلیة من لغة إلى أخرى أمراً روتینیاً. وعلى الرغم من أنھا لیست مثالیة، إلا أن ھذه الطرق وفّرت طریقة جدیدة تمامًا للتفكیر في اللغة.

وھنا جاء دور جیامینج لوه وریجینا برزیلاي من معھد ماساتشوستس للتكنولوجیا ویوان تساو من مختبر جوجل للذكاء الاصطناعي في مدینة ماونتن فیو بولایة كالیفورنیا. طوّر ھذا الفریق نظاماً للتعلّم الآلي یمكنه فك رموز اللغات المندثرة، وقد أثبتوا ذلك من خلال جعله یقوم بفك رموز النظام الخطي (ب)، وھي المرة الأولى التي یتم فیھا ذلك بشكل آلي. وكان الأسلوب الذي استخدموه مختلفاً
تماماً عن أسالیب الترجمة الآلیة التقلیدیة.

ولنتحدث أولاً عن بعض المعلومات الأساسیة.

إن الفكرة الھامة وراء الترجمة الآلیة تكمن في إدراك ارتباط الكلمات ببعضھا بطرق متشابھة، بغض النظر عن اللغة المعنیة.

لذلك، تبدأ العملیة بتحدید ھذه العلاقات للغة معینة. وھذا یتطلب قواعد بیانات ضخمة من النصوص. تقوم الآلة بعد ذلك بالبحث في ھذه النصوص لمعرفة مدى تكرار ظھور كل كلمة بجوار كل كلمة أخرى. یعدّ ھذا النمط الظاھري أمراً ممیزاً وفریداً ویعرّف الكلمة في فضاء متغیر متعدد الأبعاد. وفي الواقع، یمكن اعتبار الكلمة بمثابة موجِّه ضمن ھذا الفضاء. ویعمل ھذا الموجِّھ كعامل مقیّد قوي لكیفیة ظھور الكلمة في أي ترجمة تُصدرھا الآلة.

تخضع ھذه الموجِّھات لبعض القواعد الریاضیة البسیطة. فعلى سبیل المثال: ملك – رجل + امرأة = ملكة. ویمكن اعتبار الجملة مجموعة من الموجِّھات التي یتبع أحدھا الآخر لتشكل نوعاً من المسارات عبر ھذا الفضاء.

وإن الفكرة الرئیسیة في تمكین الترجمة الآلیة تتمثل في أن كلمات اللغات المختلفة تشغل نفس النقاط في فضاءاتھا المتغیرة الخاصة بھا. وھذا ما یجعل من الممكن تحدید الارتباط بین لغة بأكملھا مع لغة أخرى من خلال التطابقات الفردیة.

وبھذه الطریقة، تصبح عملیة ترجمة الجمل عبارة عن عملیة للعثور على مسارات مماثلة عبر ھذه الفضاءات. ولا تحتاج الآلة أبداً إلى “معرفة” معنى الجمل.

وتعتمد ھذه العملیة على مجموعات البیانات الكبیرة بشكل أساسي. ولكن قبل عامین، أظھر فریق من الباحثین الألمان كیف یمكن لاستخدام طریقة مماثلة مع قواعد بیانات أصغر بكثیر أن یساعد في ترجمة اللغات الأكثر ندرة التي تفتقر إلى قواعد البیانات الكبیرة من النصوص. تكمن الفكرة في العثور على طریقة مختلفة لتقیید طریقة الآلة التي لا تعتمد على قاعدة البیانات.

والآن، ذھب لوه وزملاؤه إلى أبعد من ذلك لإظھار كیف یمكن للترجمة الآلیة فك رموز اللغات التي اندثرت بالكامل. وترتبط القیود التي یستخدمونھا بالطریقة المعروفة لتطوّر اللغات مع مرور الوقت.

وتتمثّل الفكرة في أن أي لغة یمكن أن تتغیر بطرق معینة فقط. فعلى سبیل المثال، تظھر الرموز في اللغات القریبة من بعضھا وفق توزّع متشابه، وتتضمن الكلمات القریبة نفس ترتیب الحروف، وھلمّ جراً. ومع استخدام ھذه القواعد لتقیید الآلة، یصبح فك رموز اللغة أسھل بكثیر، بشرط أن تكون اللغة التي تنحدر منھا معروفة.

قام لوه وزملاؤه باختبار ھذه التقنیة مع لغتین مندثرتین، وھما النظام الخطي (ب) واللغة الأوغاریتیة. یعرف اللغویون أن النظام الخطي (ب) یعدّ نسخة أولیة من اللغة الیونانیة القدیمة وأن اللغة الأوغاریتیة التي تم اكتشافھا في عام 1929 ھي شكل مبكر من أشكال اللغة العبریة.

وبالاعتماد على تلك المعلومات والقیود التي یفرضھا التطوّر اللغوي، فإن آلة لوه وزملائه تمكّنت من ترجمة اللغتین بدقة استثنائیة؛ إذ یقولون: “لقد تمكنا من ترجمة 3.67% من الكلمات المشتركة للنظام الخطي (ب) بشكل صحیح إلى ما یعادلھا في اللغة الیونانیة خلال عملیة فك الرموز. على حدّ علمنا، فإن تجربتنا ھي المحاولة الأولى لفك رموز النظام الخطي (ب) بشكل آلي”.

یعدّ ھذا العمل مثیراً للإعجاب وینقل الترجمة الآلیة إلى مستوى جدید. ولكنه یثیر أیضاً السؤال المھم عن اللغات الأخرى المندثرة، خاصة تلك التي لم یتم فك رموزھا مطلقاً، مثل النظام الخطي (أ).

في ھذه الدراسة، یعتبر من الواضح اندثار النظام الخطي (أ). بل إن لوه وزملاءه لم یقوموا بذكره حتى، ولكن لا بدّ من أنهم قد فكروا فیه، كما ھو الحال بالنسبة لجمیع اللغویین. ولا تزال ھناك حاجة إلى اكتشافات وتطورات كبیرة قبل أن یصبح ھذا النظام الخطي قابلاً للترجمة الآلیة.

على سبیل المثال، لا أحد یعرف اللغة التي یعتمد علیھا النظام الخطي (أ). إذ فشلت كافة محاولات فك رموزه وترجمتھا إلى اللغة الیونانیة القدیمة. ولا تعمل التقنیة الجدیدة من دون وجود لغة ینحدر منھا ھذا النظام.

لكن المیزة الكبیرة للطرق التي تعتمد على الآلات ھي إمكانیة اختبارھا للغة تلو الأخرى بسرعة ودون أن تتعرّض للتعب. لذا فمن الممكن تماماً أن یقوم لوه وزملاؤه بفك رموز النظام الخطي (أ) باستخدام أسلوب قسري، أي ببساطة من خلال محاولة ترجمته إلى كافة اللغات التي تعمل علیھا الترجمة الآلیة حالیاً.

إذا نجح ذلك الأمر، فسیكون بمثابة إنجاز مثیر للإعجاب، لدرجة أن مایكل فینتریس نفسه سیكون مندھشاً منه.

المصدر: arxiv.org/abs/1906.06718:
Neural Decipherment via Minimum-Cost Flow: from Ugaritic to Linear