حوار مع مدير الهندسة في جوجل الدكتور عماد زيتوني حول أهمية البيانات في بناء نماذج لغوية عربية

يرى مدير الهندسة في شركة جوجل، الدكتور عماد زيتوني، أن البيانات التي تعكس الثقافة والتراث العربي هي ضرورة لا غنى عنها إذا أردنا أن نبني نماذج لغوية عربية كبيرة يمكنها أن تنافس على المستوى الدولي، مشيراً إلى ضرورة اتخاذ الدول العربية خطوات إضافية لتعزيز حضورها في هذا المجال الحيوي، منها الشروع في إطلاق مشروعات تعاونية على نطاق واسع.

وأوضح الدكتور زيتوني في مقابلة أجراها مع "إم آي تي تكنولوجي ريفيو العربية" أن هناك تقدماً كبيراً حدث خلال الفترة الأخيرة لتقليل ميل النماذج إلى "الهلوسة"، لكنه عبر عن اعتقاده بأنه لا يمكن القضاء على الهلوسة تماماً باستخدام البنية المستخدمة في النماذج اللغوية الحالية.

وفي سياق حديثه عن التطور التاريخي لتكنولوجيا الذكاء الاصطناعي، شرح الدكتور زيتوني -الذي صُنف ضمن قائمة إم آي تي تكنولوجي ريفيو لأبرز خبراء الذكاء الاصطناعي العرب 2022- أهم المراحل التي مرت بها هذه التكنولوجيا حتى وصلت إلى ما هي عليه اليوم، مشيراً إلى اختلافه مع توقعات الوصول إلى "الذكاء الاصطناعي العام" خلال السنوات القليلة القادمة ما دامت النماذج تعتمد على اللغة والصور فقط للتعلم.

يعمل الدكتور عماد زيتوني حالياً مدير الهندسة في شركة جوجل، حيث يقود جهود البحث والتطوير في مجال فهم اللغة الطبيعية لتعزيز قدرات محرك البحث والمساعد الصوتي الخاص بالشركة. سبق له العمل مديراً رئيسياً للأبحاث في شركة مايكروسوفت، وعالماً رئيسياً وقائد فريق في مركز أبحاث "آي بي إم". كما عمل أستاذاً مساعداً في جامعة هنري بوانكاريه الفرنسية، وهو حاصل على درجة الدكتوراة عام 2000 والماجستير عام 1996 في علوم الكمبيوتر من جامعة هنري بوانكاريه، وحصل على درجة البكالوريوس عام 1995 من المدرسة الوطنية لعلوم الحاسوب في تونس.

في البداية هل يمكن أن تقدّم لنا نبذة عامة حول أهم أبحاثك ومشاريعك الحالية في المجالات المرتبطة بالذكاء الاصطناعي؟

أنا أعمل في مجال الذكاء الاصطناعي منذ عام 1994. في السنوات الأخيرة، وخلال عملي في جوجل، ازداد التركيز على النماذج اللغوية الكبيرة (Large Language Models -LLMs)، وخصوصاً كيفية استخدام هذه النماذج في البحث. أنا جزء من فريق البحث الذي يركز على موضوعات مثل تقليل الهلوسة (AI Hallucination) والنماذج المتعددة الوسائط (Multimodal AI) وكيفية تحسين ترتيب النتائج.

في أثناء عملي لدى مايكروسوفت، كنت أقود الفريق المسؤول عن الذكاء الاصطناعي الحواري (Conversational AI) وفهم اللغة الطبيعية، وساعدت على توفير الخبرة التقنية والحلول لمنتجات مثل المساعد الرقمي كورتانا (Cortana) ومحرك البحث بينغ (Bing). قبل ذلك، خلال عملي في شركة "آي بي إم" ساهمت في العديد من الحلول التكنولوجية القائمة على التعلم الآلي وفي تطوير أنظمة الترجمة الآلية (Machine Translation) وبناء أنظمة تستخرج المعلومات التي تهم المستخدمين من الكلام والنصوص وترجع النتائج بلغة المستخدم، ما يتيح للمستخدم التفاعل مع النظام باللغة الطبيعية. أما في شركة مختبرات بل (Bell Labs)، فقد ساعدت في اقتراح حلول ومنتجات مرتبطة بمجال معالجة اللغة الطبيعية وأنظمة الحوار المنطوق والتعرف على الكلام (Speech Recognition) وفهم الكلام (Speech Understanding) وتطويرها.

علاوة على ذلك، قدمت إسهامات مهمة في استخدام النماذج اللغوية الكبيرة في التعرف على الكلام، وهو التخصص الذي حصلت على درجة الدكتوراة فيه عام 2000. وبالطبع، عندما نتحدث عن النماذج اللغوية الكبيرة في عام 2000 فإننا نتحدث عن شيء مختلف تماماً عن النماذج المتاحة لدينا اليوم، سواء من ناحية التقنية المستخدمة أو بنية هذه النماذج أو البيانات التي تحتوي عليها.

معظم أنظمة الذكاء الاصطناعي طُوِّرت بالأساس باستخدام بيانات باللغة الإنجليزية، ومؤخراً بدأت الشركات الصينية تطوير نماذج تركز بصورة أساسية على اللغة الصينية، فما أبرز التحديات أمام بناء أنظمة ذكاء اصطناعي تركز على اللغة العربية؟

أرغب في الإجابة عن هذا السؤال من زاوية مختلفة تتعلق بماهية البيانات. فالبيانات، بالنسبة لي وللعديد ممن يعملون في هذا الميدان، تنقسم إلى أنواع متعددة. هناك بيانات توفر ما يُسمى بالمعرفة الواقعية (Factual knowledge) التي تشير إلى المصطلحات والحقائق التي يتفق عليها الجميع، كأن نقول مثلاً إن شخصاً ما يعمل في دولة الإمارات العربية المتحدة، أو أن نذكر طول الممثل الأميركي توم كروز. هذه المعلومات لا خلاف عليها وتندرج ضمن إطار المعرفة العامة. وهناك نوع آخر من البيانات يعكس الخصوصيات الثقافية ويحمل آراءً تختلف من دولة لأخرى ومن مجتمع لآخر.

فيما يخص النماذج العربية، هناك بيانات باللغة العربية تتضمن وقائع وبيانات أخرى تعكس الجوانب الثقافية والفكرية في العالم العربي. أعتقد أن أحد التحديات التي نواجهها هو كيفية جعل النموذج اللغوي يعكس التفكير والثقافة العربيين، ولكي يحدث هذا ينبغي أن نغذيه ببيانات تتعلق بالثقافة العربية وليس ببيانات باللغة العربية فقط. وبالتالي، فإعطاء النموذج بيانات بشأن حدث معين متفق عليه، باللغة الإنجليزية مثلاً واستخدام الترجمة الآلية لترجمته إلى العربية، سيكون مفيداً للغاية للنموذج لكنه لن يساعده على امتلاك المعلومات المرتبطة بالثقافة المحلية وفهمها.

أحد الأمثلة التي أود ذكرها هنا هو أنني عندما زرت دولة قطر مؤخراً لاحظت أن هناك 3 بوابات للمترو؛ واحدة للرجال وأخرى للنساء وثالثة للعائلات. هذا الأمر مرتبط بالخصوصية الثقافية هناك. إذا ذهبت في لندن وسألت عن مثل هذه البوابات، فلن يفهم أحد الفكرة. وبالتالي، فالبيانات الخاصة بمثل هذا الموضوع تعكس جانباً من الخصائص الثقافية في الدول العربية، وهذا النوع من البيانات هو الذي يجب أن تتضمنه النماذج.

لكن كيف يمكن الوصول إلى مصادر لمثل هذه المعلومات؟

ثمة العديد من المصادر، بما فيها وسائل التواصل الاجتماعي والدراسات العلمية والوثائق المحلية التي تشرح القوانين الداخلية والقومية، بالإضافة إلى الكتب التي تعرض الجوانب الثقافية والتقاليد العربية، وهناك وثائق تشرح طريقة التعامل بين الأشخاص في المجتمعات.
في الوقت الحاضر، عندما تتحدث إلى الذكاء الاصطناعي في مسائل خاصة بالمعاملات الشخصية، فإنه يخرج بنتائج تعكس التفكير والرأي العام الغربيين، وهذا ليس سيئاً بالطبع، ولكن إذا كنا نرغب في ترك تأثيرنا على الذكاء الاصطناعي وفي أن يعكس طرق التفكير والعادات الموجودة في العالم العربي فعلينا أن نجمع هذه البيانات أولاً ثم نجعل النموذج اللغوي يتكيف معها، وبذلك يمكننا القول إننا نمتلك نموذجاً لغوياً عربياً. لا يمكن أن نمتلك مثل هذا النموذج عبر تزويده فقط بمعلومات متفق عليها عالمياً لمجرد أنها باللغة العربية.

يلجأ الباحثون أحياناً إلى البيانات المصطنعة والترجمة الآلية من اللغات الأخرى للتغلب على مشكلة محدودية توفر البيانات. من وجهة نظرك، هل تؤثر هذه الأساليب في جودة البيانات أو تعكس رؤى ثقافية مرتبطة باللغة التي تُرجمت البيانات منها؟

ثمة زاويتان ينبغي استعراضهما في الإجابة عن هذا السؤال؛ تتعلق الزاوية الأولى بجودة النموذج، وهنا يمكن القول إن الترجمة الآلية والبيانات المصطنعة (Synthetic data) قد تعتبران ضروريتين للغاية في عملية التدريب، لأن النماذج تحتاج إلى كمية ضخمة من البيانات ومن الصعب الحصول عليها من خلال زحف الويب (Web Crawling) فقط. لذلك فهذه الأساليب رائعة، وأعتقد أن النماذج العربية الرائدة استخدمتها، طبعاً بالإضافة إلى استخدامها للبيانات المتوفرة على الإنترنت باللغة العربية.

أما بالنسبة للزاوية الثانية، فإن عدم استخدام بيانات تتضمن المحتوى الخاص بالثقافة لن يجعل النموذج يعكس الجانب الثقافي. في الوقت الحاضر، تقاس قوة النماذج الكبيرة باستخدام مجموعة من المعايير المرجعية (Benchmarks)؛ يمكن لهذه المعايير أن تقيس الجوانب العلمية والمعرفة العامة التي يمتلكها النموذج لكنها لا تعكس الجوانب المتعلقة بالثقافة والمجتمع. بالطبع، إذا كنت تفكر في مدى قوة نموذجك وفقاً لهذه المعايير، فالترجمة والبيانات المصطنعة ستساعدك على التفوق، وأعتقد أن العالم العربي يشهد تقدماً عظيماً في هذا الجانب. لكن ما أفكر فيه عندما نتحدث عن نموذج لغوي كبير للغة العربية هو أننا نمتلك فرصة لنعرض أفكارنا ونظرتنا للعالم، لذلك فنحن نحتاج إلى بيانات تعكس هذه النظرة.

يتعلق الأمر في النهاية بالكيفية التي ننظر بها إلى نماذج الذكاء الاصطناعي. إذا كنا نعتبرها مجرد أداة لنقل المعلومات الموجودة على الإنترنت فلماذا ننشئ نموذجاً عربياً كبيراً من الأساس؟ يمكننا أن نأخذ أي نموذج مطور في الولايات المتحدة ونضيف إليه طبقة محول (Adapter Layer) للغة العربية. في هذه الحالة، إذا سألته باللغة العربية: كيف حال الطقس اليوم؟ أو ما هو طول باراك أوباما؟ فسيجيبك بسهولة. لكني أعتبر النموذج أداة لإظهار الكيفية التي ترى بها هذه المنطقة العالم وكيف تؤثر فيه.

هل يمكن أن تعطينا مثالاً على هذه الفكرة؟

المثال البارز في الوقت الحاضر هو القضية الفلسطينية. هل التفكير الغربي في القضية الفلسطينية يمثل وجهة النظر السائدة في العالم العربي نفسها؟ أنا لا أقول إن هذا صحيح وذاك خاطئ، وإنما أرى أنه من المهم أن يعرض النموذج وجهتَي النظر.

كيف ترى تأثير الجهود الكبيرة التي تنفذها بعض الدول العربية، وتحديداً الإمارات والسعودية، في دعم الأبحاث والتطبيقات والقدرات المتعلقة بمجالات الذكاء الاصطناعي واللغة العربية؟

أنا معتز وفخور بالاستثمارات التي تنفذها دول الخليج العربي في هذا المجال، سواء في صورة إنشاء جامعات ومراكز بحثية أو تطوير نماذج لغوية كبيرة، مثل نموذج "جيس" الذي طورته جامعة محمد بن زايد للذكاء الاصطناعي والذي يحتوي على 13 مليار معامل وسيط. بالإضافة إلى ذلك، تشجع هذه الدول عمليات البحث العلمي وتوظف باحثين رفيعي المستوى. هذه خطوات أولى رائعة، ومع ذلك، أعتقد أنه بإمكاننا فعل المزيد.

في المرحلة القادمة، أتمنى أن تبدأ الأبحاث في العالم العربي في التحول بدرجة أكبر نحو التعاون المشترك، وأن نرى عملاً تعاونياً بين المؤسسات والجامعات لإنشاء نموذج أساس (Foundation Model). عندما تنظر إلى ما يحدث في الدول الغربية، لن تجد أن كل شركة وكل دولة تسعى لبناء نموذجها الخاص، وإنما ستجد 3 أو 4 نماذج أساس كبيرة ومعظم الشركات تطور تطبيقاتها بناءً عليها. لذلك، أتمنى أن تركز الأبحاث في العالم العربي على إنشاء نموذج أساس عربي كبير، لا سيما أن هذه المهمة ليست سهلة وتتطلب قدرات كبيرة سواء من ناحية كمية البيانات ونوعيتها أو قوة الحوسبة المطلوبة أو الباحثين والخبراء في هذا المجال، وسيكون من الصعب على أي شركة أو مركز بحثي أن يمتلك كل هذه الإمكانات منفرداً. والأمر الجيد هو أن العديد من الدول العربية تعي أن هذه التكنولوجيا هي المستقبل.

ما النصيحة التي تقدمها للعلماء أو الباحثين العرب الطموحين في مجال الذكاء الاصطناعي؟

نصيحتي هي إيلاء المزيد من الاهتمام للأساسيات، وتحديداً الجوانب الرياضية من التكنولوجيا. أعتقد أن بنية النماذج اللغوية الكبيرة في الوقت الحاضر أبعد ما تكون عن الكمال، والفرصة متاحة لتحسينها.

لذلك، نصيحتي لشباب الباحثين هي التركيز على فهم كيفية بناء النماذج والشبكات العصبونية ومعالجة اللغات الطبيعية، وأساس هذه التقنيات يكمن في الرياضيات؛ إذا كنت تمتلك هذا الأساس فالتقدم سيكون أسهل. بعد ذلك يأتي دور التعاون والتنسيق، لا أعتقد أن باحثاً منعزلاً يمكنه أن يحقق الكثير بمفرده.

لننتقل الآن إلى موضوع آخر يرتبط بمسألة الهلوسة. ما الأساليب التي يستكشفها الباحثون لجعل أنظمة الذكاء الاصطناعي أقل عرضة للهلوسة؟ وهل يمكن أن تختفي الهلوسة نهائياً من أنظمة الذكاء الاصطناعي في المستقبل؟

السبب الأساسي للهلوسة هو بنية النماذج اللغوية الحالية، فالنموذج يستخدم المعلومات الموجودة في البيانات التي تمت تغذيته بها ويحاول أن يستنتج الكلمة أو الجملة التالية بناءً على الاحتمالات. لذلك، ستكون الجملة صحيحة بنسبة كبيرة من الناحية النحوية (Syntactic)، لكن ستظل هناك فروقات دقيقة من الناحية الدلالية (Semantic).

ومع ذلك، يمكن تقليل الهلوسة بدرجة كبيرة وجعل الأنظمة أكثر موثوقية بمرور الوقت. وهناك الكثير من التقنيات الجديدة التي تساعد على مواجهة هذه المشكلة، منها تقنية التوليد الاسترجاعي المعزز (Retrieval-augmented generation - RAG)، التي تُستخدم لتعزيز دقة نماذج الذكاء الاصطناعي التوليدي وموثوقيتها باستخدام حقائق مستمدة من مصادر خارجية. وهناك أيضاً تقنية جديدة تُسمى سلسلة الأفكار (Chain-Of-Thought - CoT)، وهي أسلوب يهدف إلى تحسين أداء النماذج اللغوية الكبيرة في المهام التي تتطلب المنطق والحساب واتخاذ القرار من خلال تنظيم الأوامر بطريقة تحاكي الطريقة البشرية، لتشجيع النماذج على تقسيم المشكلة الرئيسية إلى مجموعة من المشكلات البسيطة وشرح خطوات وصولها إلى الجواب.

بالطبع، أُحرز تقدم كبير نحو تقليل ميل النماذج إلى الهلوسة، لكن لا يزال هناك الكثير من العمل اللازم قبل حل هذه المشكلة. وفي رأيي، لا يمكن القضاء على الهلوسة تماماً باستخدام البنية المستخدمة في النماذج حالياً. أتوقع أن الحل يكمن في تطوير بنية جديدة، لأن التكنولوجيا الحالية تحمل بذور الهلوسة بطبيعتها.

هل تؤيد تسهيل استخدام أدوات الذكاء الاصطناعي أم منعه في المؤسسات التعليمية والأكاديمية؟

بالتأكيد أنا أؤيد استخدام هذه الأدوات والبرامج في المدارس، وتدريب التلاميذ والأساتذة أيضاً على استخدامها. ببساطة لأن هذه البرامج ستصبح جزءاً من حياتنا اليومية وأعمالنا، لذلك فإن توعية الطلاب بكيفية استخدامها ومشاكلها هو أمر ضروري. وبما أننا كنا نتحدث عن الهلوسة، أعتقد أنه ينبغي أن نشرح للطلاب ماهية الهلوسة وتوجيههم بألا يثقوا في النماذج ثقة عمياء، وهذا الأمر يتطلب أولاً أن يكون المعلم على دراية بهذه الأدوات وكيفية استخدامها.

لكن ألا يمكن أن يتسبب هذا في تزايد اعتماد الطلاب على أدوات الذكاء الاصطناعي، ما يؤدي إلى تراجع مهاراتهم البحثية وقدرتهم على التفكير النقدي والتحليل؟

حسناً، أنا أتفهم وجهة النظر هذه، لكنها تذكرني برفض المعلمين في الماضي أن يستخدم الطلاب الآلة الحاسبة في المدارس بحجة أنها تضعف قدرة الطلاب على التفكير وحل مسائل الرياضيات بأنفسهم. اليوم، نستخدم جميعاً الآلات الحاسبة ولم يحدث ما كان يخشاه المعلمون، لأنها توفر الكثير من الوقت الذي نحتاجه لمواجهة مشكلات أكثر تعقيداً. أنا أنظر الآن إلى النماذج اللغوية باعتبارها أدوات تساعدنا في العثور على المعلومات والملخصات بسرعة.
وعلى العكس، أرى أن الذكاء الاصطناعي سيساعد الطلاب أكثر وسيحسن عملية البحث، لكن طريقة البحث ستكون مختلفة لأنها ستركز على أمور مثل مدى صحة المعلومة ومصدرها ودرجة موثوقية المصدر. ومن الإيجابيات الأخرى للبحث باستخدام الذكاء الاصطناعي أنه قد يوفر لك معلومات متاحة باللغة الصينية مثلاً وغير متاحة باللغة الإنجليزية أو العربية، وبالتالي لم تكن لتحصل عليها بطرق البحث العادية.

سؤالي التالي هو: كيف وصلنا إلى هنا؟ ما أبرز الإنجازات أو المراحل التي شهدتها أبحاث الذكاء الاصطناعي وساهمت في تطور هذه التكنولوجيا إلى ما هي عليه اليوم؟

يمكن تلخيص مراحل تطور الذكاء الاصطناعي في 4 أو 5 مراحل. المرحلة الأولى يمكن أن نرجعها إلى أعمال عالم الرياضيات الروسي، آندريه ماركوف؛ إذ توصل عام 1913 في أثناء عمله في أكاديمية العلوم بمدينة سانت بطرسبرغ إلى أن ترتيب الحروف في الكلمات ليس اعتباطياً، بل يرتبط بالاحتمالات. بمعنى أنه عندما يكون لدينا 3 أو 4 حروف في كلمة فالحرف التالي في الكلمة لا يكون عشوائياً، وإنما تحدده عملية إحصائية. درس ماركوف هذه الإحصائيات قبل اختراع الحاسوب، وبنى نظريته التي توضح أن ترتيب الحروف لا يحدث بطريقة عشوائية.

المرحلة الثانية بدأت مع كلود شانون، الذي نشر في عام 1950 دراسة بعنوان التنبؤ والإنتروبيا في اللغة الإنجليزية المطبوعة (Prediction and Entropy of Printed English). قدم شانون -وهو من مؤسسي نظرية المعلومات- في دراسته فكرة الإنتروبيا (الاعتلاج) باعتبارها طريقة لقياس كمية المعلومات أو العشوائية في النصوص اللغوية، تعتمد هذه الطريقة على النتائج التجريبية في التنبؤ بالحرف التالي عند معرفة النص السابق.

بعد ذلك، جاء فريدريك جيلينك، الذي كان أحد رواد استخدام التحليل الإحصائي لفهم اللغة، وقدم مساهمات بارزة أثرت بدرجة كبيرة في تطور الذكاء الاصطناعي. قدم جيلينك الصيغة الرياضية الأولى للنمذجة اللغوية لترتيب الكلمات في الجملة، بالطبع لم يكن يعمل وحده وإنما بالتعاون مع زملائه في شركة "آي بي إم". وفي عام 1985، نشر جيلينك مع روبرت ميرسير دراسة حول تقدير التوزيع الاحتمالي للبيانات المتفرقة، وهي دراسة مهمة في مجال نمذجة اللغة وتقنيات التقدير الاحتمالي.

الخطوة التالية حدثت في عام 2000، عندما بدأ أستاذ علوم الحاسوب في جامعة مونتريال، يوشوا بينجيو -الذي يُشار إليه أحياناً مع جيفري هينتون ويان ليكون باعتبارهم "الآباء الروحيين للذكاء الاصطناعي"- أبحاثه لتطبيق الشبكات العصبونية على النماذج اللغوية. وفي دراسة مهمة نشرها في دورية أبحاث التعلم الآلي (JMLR) في عام 2003، قدم بينجيو نموذجاً لغوياً يتعلم التمثيلات الموزعة للكلمات، ووضع بذلك أسس النماذج اللغوية الكبيرة الحديثة من خلال إظهار أن الشبكات العصبونية يمكن أن تتعلم أنماطاً في اللغة البشرية من خلال التنبؤ بالكلمة التالية.

المرحلة الأخيرة بدأت في عام 2017 مع نشر باحثين في شركة جوجل الدراسة التي حملت عنوان (Attention Is All You Need). أحدثت هذه الدراسة تغييراً جذرياً في مفهوم النماذج اللغوية، حيث بُنيت جميع النماذج الحالية على أساس آلية الانتباه وبنية المحول (Transformer Architecture) اللتين قدمتهما هذه الدراسة. وقد بدأ استخدام المحولات -التي يمثلها حرف (T) في (GPT)، وهي اختصار عبارة المحول التوليدي المدرب مسبقاً (Generative Pre-trained Transformer)- في عام 2017. وفي عام 2019، بدأت شركة "أوبن أيه آي" استخدام هذه التقنية بطريقة المحادثة، بمعنى أنه بات بالإمكان الحصول على البيانات من النموذج عن طريق الدردشة.

بما أننا استعرضنا الجانب التاريخي، لنتحدث الآن عن المستقبل. ما توقعاتك لتطور الذكاء الاصطناعي على المديين القريب والبعيد؟

على المدى القريب، أتوقع أن نشهد تقدماً كبيراً في تطبيقات الذكاء الاصطناعي واستخدامه في القطاع الصناعي. يمكنك أن تلاحظ مدى سرعة تحسن تطبيقات معالجة اللغة الطبيعية (NLP) وتوليد الصور، ما يسهل مهام مثل الترجمة الآلية والتعرف على الكلام واستخراج المعلومات وإنشاء الصور والتعرف عليها.

أما على المدى البعيد، فأعتقد أن الذكاء الاصطناعي سيكون جزءاً لا يتجزأ من الحياة اليومية للبشر. ستكون تلك النماذج اللغوية الكبيرة جزءاً من هاتفك ومن كمبيوترك. وفي مرحلة ما، أتوقع أن يكون لكل شخص مساعد شخصي ذكي يمكنه أداء العديد من المهام والرد على رسائل البريد الإلكتروني بسرعة، وحتى فهم أمور مثل ما إذا كانت ثلاجتك تحتوي على الطعام الذي تحتاج إليه أم لا. هذه التطبيقات قادمة بلا شك عاجلاً أو آجلاً.

لكن كل هذه التطورات تحتاج إلى الحوكمة. يجب العمل على مسألة الأخلاقيات وكيفية التحكم في هذا التقدم وإلا فإنه قد يسير في اتجاهات خاطئة. الأمر لا يختلف كثيراً عن اختراع ألفريد نوبل للديناميت، حيث استخدمه البشر في أمور سلمية مفيدة وفي أعمال الحرب أيضاً. لذا، فالاهتمام بقواعد الحوكمة من الآن ضروري للغاية، لا سيما أن قدرات الذكاء الاصطناعي على الإقناع تفوق قدرات معظم البشر لأنه يستخدم لهجة حاسمة توحي بالثقة فيما يقوله، ولهذا قد يسبب مشاكل في قضايا خطيرة مثل التأثير في نتائج الانتخابات.

إلى أي مدى تعتقد أننا اقتربنا من تحقيق الذكاء الاصطناعي العام؟

يتكرر هذا السؤال كثيراً، لكن الإجابة تتطلب أولاً تعريف الذكاء الاصطناعي العام (AGI). هل نعني به نظاماً ذكياً يفكر مثل الإنسان؟ في اعتقادي، التكنولوجيا المتاحة لدينا حالياً لن تمكننا من الوصول إلى هذا النوع من الذكاء الاصطناعي؛ ببساطة لأن الإنسان لا يتعلم باستخدام اللغة وحدها بل يعتمد على حواس مختلفة مثل الرؤية والسمع وعلى التفاعلات الحسية مثل تحريك اليد أو لمس الأشياء، وهي أمور تؤثر بدرجة كبيرة في خبراتنا وطرق تفكيرنا. لذلك، أظن أن وصول الذكاء الاصطناعي إلى هذه المرحلة المتقدمة بالاعتماد على اللغة والصور فقط سيكون صعباً.

ماذا عن التجارب التي يحاول فيها الباحثون وضع الذكاء الاصطناعي في روبوت مثلاً ليعيش في العالم الحقيقي ويكتسب خبرات بطريقة البشر نفسها؟ هل يمكن أن يساعد هذا الأمر على تخطي هذه المشكلة؟

يمكن لهذه الأفكار أن تكون مفيدة بالفعل، فالوصول إلى الذكاء الاصطناعي العام ليس مستحيلاً تماماً، لكني فقط لا أعتقد أننا سنرى هذا اليوم خلال السنوات القليلة القادمة، خاصة مع التكنولوجيا المتاحة حالياً. ومع ذلك، فهذا الأمر سيحدث بالتأكيد في المستقبل مع تطوير بنية جديدة للنماذج واستخدام أدوات مثل الروبوتات والسيارات الذاتية القيادة التي يمكنها استقبال الإشارات من مصادر متنوعة.