كيف سيكون للكاميرا دور بارز في مستقبل التنقل؟

4 دقائق
دور الكاميرا البارز في مستقبل التنقل
الصورة الأصلية: أنسبلاش | تعديل: إم آي تي تكنولوجي ريفيو العربية

نشرة خاصة من جامعة محمد بن زايد للذكاء الاصطناعي

لنتخيّل سوياً هذا المشهد: أحدهم يصعد إلى سيارته التي تبدو كمقصورة صغيرة بتصميم مختلف عن السيارات المألوفة، ويستخدم شاشة الحاسوب لإدخال تفاصيل وجهته ثم يجلس مسترخياً، لتنطلق السيارة بمفردها على الطريق. ثم يسمع تنبيهاً ينبئه بوصوله إلى وجهته المنشودة، ويقوم بعدها بإرسال السيارة لتنفيذ مهام أخرى في المنزل. ورغم التشابه بين هذا المشهد وأفلام الخيال العلمي، لكنه لا ينتمي إليها، بل إنه المستقبل الذي ينتظرنا جميعاً.

وبطبيعة الحال، هناك الكثير من المعارك التي ينبغي خوضها قبل أن تتبلور تلك الرؤى الحالمة في نسيج الواقع. وتدور رحى المعركة الحالية بين الكاميرات من جهة وتقنية "ليدار" (LiDAR) من جهة أخرى. وفي حلبة النزال الافتراضية هذه، يحتل زعيم شركة تسلا إيلون ماسك الزاويةَ الحمراء، بينما يحتشد البقية في الزاوية الزرقاء المقابلة. وقد تبدو حرب الكلمات هذه غريبة للغاية إذا ما وقعت على مسامع الجمهور غير المطلع، لكن يمكن أن ترسم نتيجتها ملامح مستقبل التنقّل كما نعرفه.

ويرتكز مفهوم المركبات ذاتية القيادة في جوهره على قدرة السيارة على "رؤية" الأجسام الموجودة في الطريق والتعرف عليها، سواء تمثّلت هذه الأجسام بالمركبات الأخرى أو المشاة أو حتى راكبي الدراجات.

وبشكل أساسي، يتم إنجاز الجزء المتعلق بالرؤية بواسطة نظام ليدار المستخدم اليوم بصورة اعتيادية في السيارات ذاتية القيادة التي تنتجها شركة "وايمو" التابعة لمجموعة ألفابت ونظيراتها من شركة كروز التابعة لمجموعة جنرال موتورز، وكذلك أوبر.

ومع ذلك، يؤمن ماسك بأن الكاميرات -وليس تقنية ليدار- هي التي سيكون لها اليد العليا في نهاية المطاف. واستبعد ماسك أن تلعب هذه التقنية أي دور في مستقبل القيادة الذاتية، واصفاً إياها بكونها "فكرة لا طائل منها"، وقال أيضاً إن "أي شخص يعتمد على تقنية ليدار سيكون مصيره الفشل الحتمي". كما وصف هذه التكنولوجيا بكونها "مجرد أجهزة استشعار باهظة التكلفة وغير ضرورية".

 

MBZUAI

ويمكن لفريق يضم باحثاً من جامعة محمد بن زايد للذكاء الاصطناعي تسوية هذا الخلاف الحاد بشكل نهائي؛ حيث قدم الدكتور هانج داي من جامعة محمد بن زايد للذكاء الاصطناعي رفقة فريق من الباحثين العالميين مقترحاً يتناول تقنية توظف الكاميرات وتقدم في ذات الوقت المخرجات ثلاثية الأبعاد المتفوقة التي تقدمها أنظمة ليدار.

وفي حال كان اسم ليدار مألوفاً بالنسبة لكم، فذلك لأنه يمتلك ذات الخصائص التي يمتلكها قريبه الأكثر شهرة: الرادار. ويعد هذا الاسم اختصاراً لجملة (Light Detection and Ranging)، التي تعني الكشف وقياس المدى بواسطة الضوء، وتستخدم هذه التقنية ضوء الليزر للكشف عن الأجسام، بينما تستخدم تقنية الرادار موجات الراديو لتحقيق النتيجة ذاتها بشكل أو بآخر. وفي السيارات ذاتية القيادة أو الروبوتات، يعمل نظام "ليدار" على إنشاء خريطة بصرية ثلاثية الأبعاد من خلال ارتداد آلاف النبضات الليزرية في كل ثانية عن أحد الأجسام، ويستخدم بعدها برمجية مدمجة لتزويد المركبة برؤية محيطية بزاوية 360 درجة للطريق.

ومع ذلك، فإن التكلفة العالية لهذه التقنية وعمر خدمتها القصير يحولان دون اعتماد أنظمة ليدار على نطاق أوسع. فعلى سبيل المثال، تبلغ تكلفة الجهاز الدوار المثبت على سطح المركبة من إنتاج شركة فيلودين الرائدة على مستوى القطاع حوالي 75 ألف دولار أمريكي، بالرغم من وجود العديد من الخيارات الأقل تكلفة بكثير في مختلف مراحل الإنتاج. كما تستهلك عمليات معالجة البيانات الصادرة من نظام ليدار قدرة حاسوبية كبيرة في إحدى المركبات.

وعلى الجانب الآخر، توفر الكاميرات صوراً واضحة ونقية يمكن للشبكات العصبية وخوارزميات الرؤية الحاسوبية تحليلها وفق مستوى عالٍ من الدقة. ويتألف النظام بالمجمل من مكونات بصرية دون أن يعتمد على تقنية الكشف وقياس المدى كما هو الحال مع نظام ليدار.

وقد برهنت تسلا على قدرة السيارات ذاتية القيادة على العمل بشكل جيد باستخدام الكاميرات ودون الاعتماد على أنظمة ليدار، ويسعى الدكتور داي وفريقه إلى تحسين الخرائط البصرية الحالية التي تقدمها أنظمة الكاميرا.

وتستخدم التكنولوجيا المقترحة في ورقتهم البحثية -التي حملت عنوان: "كاشف الأجسام أحادي العدسة ثلاثي الأبعاد أحادي المرحلة" (M3DSSD: Monocular 3D Single Stage Object Detector)- نظامَ كاميرا قياسي لإنشاء صور ثلاثية الأبعاد بغرض تحليلها بواسطة الذكاء الاصطناعي.

وتستخدم النماذج الحالية أساليب قائمة على نظام كاميرا ثنائي العدسة. ويمكن لهذه النماذج أن تحقق نتائج جيدة على مستوى الكشف عن الأجسام، لكنها تعاني من ذات العيوب المتعلقة بالتكلفة العالية لأنظمة ليدار. وغالباً ما تتسم عملية معايرة الكاميرات ثنائية العدسة بصعوبة بالغة.

وعلى خلاف ذلك، تتميز الكاميرا أحادية العدسة بفعاليتها من حيث التكلفة وسهولة تجميعها. وعلاوة على ذلك، يمكن لهذه الكاميرا أن توفر ثروة من المعلومات البصرية للكشف عن الأجسام ثلاثية الأبعاد كما هو الحال مع أنظمة ليدار، وذلك باستخدام التكنولوجيا التي اقترحها داي وفريقه.

وتشهد السيارات الحديثة تواجداً مكثفاً وواسع النطاق للكاميرات التي تقدم المساعدة في جميع المهام، بداية من ركن السيارة في موقف ضيق ووصولاً إلى المساعدة في مطالبات التأمين. ومن خلال الاستفادة من هذه الأجهزة الموجودة أصلاً، يمكن أن تسمح تقنية الكشف أحادي العدسة ثلاثي الأبعاد للمركبات ذاتية القيادة بتحقيق قفزة تكنولوجية كبيرة في الاتجاه السائد ضمن قطاع السيارات.

ويوظف النظام المقترح مجموعات بيانات KITTI (معهد كارلسروه للتكنولوجيا ومعهد تويوتا للتكنولوجيا)، وهي مستودع البيانات القياسي المستخدم في الروبوتات وأنظمة القيادة الذاتية.

ويستمد داي وفريقه الإلهام من الإنسان؛ فعلى سبيل المثال، يمكن للناس أن يدركوا بسهولة مدى قرب الأجسام من موقعهم. وعندما يفسّر الدماغ البشري عمق أحد الأجسام، فهو يعتمد إلى مقارنته مع جميع الأجسام الأخرى والبيئة المحيطة للحصول على قياس دقيق بشكل معقول للمسافة والحجم.

وخلال مرحلة ما في المستقبل (بحدود عام 2030 حسب الإجماع العام)، ستعج طرقات العالم بالسيارات ذاتية القيادة. ولا يمكننا حالياً سوى وضع نظريات أو فرضيات بشأن تأثيرها الكلي، لكن من المنصف القول بأن التنقّل الذاتي سيؤدي أغراضاً أكثر بكثير من مجرد نقلنا بين نقطتين محددتين. وستحمل هذه التكنولوجيا المبتكرة تأثيرات واسعة على المكان الذي نعيش ونعمل فيه، كما أنها ستحقق نتائج مذهلة على صعيد حماية البيئة والاستدامة، وربما يتمثل الجانب الأهم بقدرتها على إنقاذ الأرواح من خلال الحد من الحوادث المرورية الناجمة عن تشتت انتباه السائقين.

وستشهد قصة التنقّل الذاتي كتابة فصول عديدة أخرى في المستقبل. وداخل تلك الصفحات، قد يكون هنالك بعض التعليمات البرمجية التي كتبها الفريق المكون من هانج داي وشوجي لو ولينج شاو ويونج دينج.