Article image
مصدر الصورة: الرسوم التوضيحية لحركات اليد: ناون بروجيكت/ إم إس تك


هذا القسم يأتيكم بالتعاون مع:


تملك التقنية الجديدة تطبيقات عديدة في مجال السيارات ذاتية القيادة وتحليل الصور الطبية وتشخيص الأمراض.

تمكَّن الباحثون من تقليص نماذج الرؤية الحاسوبية الأكثر تطوراً لتشغيلها على أجهزة مُنخفضة الطاقة.

للتطوّر آثارُه المُؤلِمة
يُعدُّ التعرُّف البصري أكثر مجال تظهر فيه براعة التعلم العميق؛ حيث تقوم خوارزميات الرؤية الحاسوبية بتحليل الصور الطبية، وتمكين السيارات ذاتيّة القيادة، وتشغيل أنظمة التعرُّف على الوجوه. غير أنَّ تدريب نماذج التعرُّف على الحركة في مقاطع الفيديو أصبحَ مُكلفاً بشكلٍ متزايد؛ مما غذَّى المخاوفَ من الآثار الكربونية لهذه التقنية ومن ازدياد محدوديّة استخدامها في البيئات فقيرة الموارد.

تفاصيل البحث
قام الباحثون في مخبر إم آي تي- آي بي إم واتسون للذكاء الاصطناعي بتطوير تقنية جديدة لتدريب نماذج التعرُّف على الفيديو باستخدام هاتف نقَّال أو أي جهاز آخر ذي سعة مُعالجة محدودة للغاية. وعادةً ما يقوم هذا النوع من التقنيات بمعالجة الفيديو عن طريق تقسيمه إلى إطارات صور ثم يُطبِّق خوارزميات التعرُّف على كل إطارٍ منها على حدة. بعد ذلك، ومن خلال مراقبة تغيُّر الأغراض في الإطارات المُتلاحقة، تتمكَّن من تجميع الحركات المعروضة في الفيديو. ويتطلَّب هذا الأسلوب أن “تتذكر” الخوارزمية ما رصَدته في كل إطار والترتيب الزمني الذي التقطته فيه؛ مما يؤدي إلى استخدام غير فعّال للموارد على نحو لا داعي له.

أما في الطريقة الجديدة، تقوم الخوارزمية -بدلاً عن الأسلوب السابق- باستخراج الرسومات الأساسية للأغراض في كل إطار، وتقوم بمراكبتها الواحدة فوق الأخرى. وعوِضاً عن تذكُّر نوعية التغيُّرات ووقت حدوثها، تستطيع الخوارزمية تكوين تصوُّر لمرور الوقت من خلال مراقبة كيفية انتقال الأغراض عبر الفضاء في هذه الرسومات. وفي مرحلة الاختبار، وجد الباحثون أن الطريقة الجديدة كانت أسرعَ بثلاث مرات من أحدث التقنيات الحالية في عملية تدريب نماذج التعرُّف على الفيديو. وفضلاً عن ذلك، تمكَّنت هذه الطريقة من تصنيف إيماءات اليد بسرعةٍ كبيرة باستخدام حاسوب صغير وكاميرا تعملان على طاقة كافية فقط لتشغيل ضوء دراجة هوائية.

ما أهمية هذه التقنية؟
قد تُمكِّننا التقنية الجديدة من تخفيض التكاليف المترتبة على التأخير والعمليات الحسابية في التطبيقات التجارية الحالية للرؤية الحاسوبية. وعلى سبيل المثال، يمكن لهذه التقنية أن ترفع درجة السلامة في السيارات ذاتيّة القيادة من خلال زيادة سرعة استجابتها للمعلومات المرئية الواردة إليها. كما يمُكن أن تفتح المجال لتطبيقات جديدة لم تكن مُمكنة في السابق، مثل استخدام الهواتف الذكية للمساعدة في تشخيص الأمراض أو تحليل الصور الطبية.

الذكاء الاصطناعي المُوزَّع
مع تحوّل المزيد من أبحاث الذكاء الاصطناعي إلى تطبيقاتٍ عملية، ستزداد الحاجة إلى نماذج أصغر. وهذا البحث من إم آي تي- آي بي إم يُمثل جزءاً من توجُّهٍ متزايد يستهدف تقليص أحدث النماذج حتى تغدو في أحجام عملية أكثر من حيث التشغيل والإدارة.


شارك



مراسلة الذكاء الاصطناعي، إم آي تي تكنولوجي ريفيو