لطالما كانت وحدات المعالجة الرسومية هي الشرائح المفضلة لأداء مهام الذكاء الاصطناعي، إلا أن شركة نيورال ماجيك تريد تغيير هذا الأمر.

2020-06-22 15:23:08

22 يونيو 2020
Article image
مصدر الصورة: شركة نيورال ماجيك

توصل نير شافيت إلى الاكتشاف الذي دفعه إلى تأسيس شركته، بنفس الطريقة التي يتم التوصل بها إلى معظم الاكتشافات: بمحض الصدفة. كان الأستاذ بجامعة إم آي تي يعمل على مشروع لإعادة بناء خريطة لدماغ الفأر، وفي حاجة إلى بعض المساعدة من تقنية التعلم العميق. ونظراً لعدم معرفته بكيفية برمجة البطاقات الرسومية (أي وحدات المعالجة الرسومية (GPUs)، وهي الأجهزة الأكثر استخداماً في نماذج التعلم العميق) فقد اختار بدلاً منها وحدة معالجة مركزية (CPU)، وهي الشريحة الحاسوبية الأكثر شيوعاً والتي توجد في أي حاسوب محمول عادي.

ويتذكر شافيت: “أدركت، فجأة، أن وحدة المعالجة المركزية قادرة على القيام بما تقوم به وحدة المعالجة الرسومية، إذا تمت برمجتها بالطريقة الصحيحة”.

شكلت هذه الرؤية الأساس الذي تقوم عليه حالياً شركته نيورال ماجيك (Neural Magic)، التي أطلقت مؤخراً المجموعة الأولى من منتجاتها. وتكمن الفكرة في تمكين أي شركة من نشر نموذج تعلم عميق دون الحاجة إلى أجهزة متخصصة. ولن يخفض هذا الأمر تكاليف التعلم العميق فحسب، وإنما سيجعل أيضاً الذكاء الاصطناعي متاحاً على نطاق أوسع.

ويقول نيل طومسون، الباحث العلمي في مختبر علوم الحاسوب والذكاء الاصطناعي التابع لجامعة إم آي تي، والذي لا يعمل في شركة نيورال ماجيك، إن “هذا يعني أنه يمكنك استخدام الشبكات العصبونية في العديد من الآلات، بما فيها تلك الموجودة حالياً بالفعل، ولن تكون في حاجة لتحديثها إلى شيء خاص”.

مصدر الفيديو: شركة نيورال ماجيك

أصبحت وحدات المعالجة الرسومية هي الأجهزة المفضلة للتعلم العميق إلى حد كبير عن طريق الصدفة، حيث تم تصميم الشرائح الإلكترونية في البداية لتنفيذ عمليات استخلاص الرسوميات بسرعة في تطبيقات من قبيل ألعاب الفيديو. وعلى عكس وحدات المعالجة المركزية التي تحتوي على ما بين أربعة إلى ثمانية نوى مركبة للقيام بمجموعة متنوعة من عمليات الحوسبة، تحتوي وحدات المعالجة الرسومية على مئات النوى البسيطة التي لا يمكنها سوى تنفيذ عمليات محددة. إلا أن هذه النوى يمكنها معالجة عملياتها في نفس الوقت، بدلاً من تنفيذها واحدة تلو الأخرى، ما يؤدي إلى تقليص الوقت الذي تستغرقه لإكمال عملية حوسبة مكثفة.

ولم يستغرق الأمر طويلاً حتى أدركت الأوساط البحثية الخاصة بالذكاء الاصطناعي أن هذا التوازي الواسع النطاق يجعل وحدات المعالجة الرسومية أيضاً أداة رائعة للتعلم العميق. وعلى غرار عملية استخلاص الرسوميات، ينطوي التعلم العميق على إجراء مئات الآلاف من الحسابات الرياضية البسيطة. وكانت شركة جوجل -بالتعاون مع شركة إنفيديا لصناعة الشرائح الإلكترونية- قد توصلت عام 2011 إلى أن نموذج الرؤية الحاسوبية الذي دربته باستخدام 2000 وحدة معالجة مركزية، بهدف التمييز بين القطط والبشر، يمكن أن يحقق نفس الأداء عند تدريبه باستخدام 12 وحدة معالجة رسومية فقط. وقد باتت وحدات المعالجة الرسومية هي الشرائح الفعلية المستخدمة في عملية تدريب النموذج وعملية الاستدلال، وهذه الأخيرة هي عملية الحوسبة التي تحدث عند استخدام نموذج مُدرَّب لتنفيذ المهام التي تم تدريبه لتنفيذها.

ومع ذلك، فإن وحدات المعالجة الرسومية ليست مثالية أيضاً للتعلم العميق. أولاً، لأنها لا يمكن أن تعمل كشريحة مستقلة؛ فنظراً لمحدودية العمليات التي تستطيع تنفيذها، يجب إرفاقها بوحدات المعالجة المركزية للتعامل مع باقي الأشياء. كما تعاني وحدات المعالجة الرسومية أيضاً من محدودية ذاكرة التخزين المؤقت، وهي منطقة تخزين البيانات الأقرب إلى مُعالِجات الشريحة، ما يعني أن معظم البيانات يتم تخزينها خارج الشريحة ويجب استرجاعها عندما يحين وقت معالجتها. ويؤدي تدفق البيانات ذهاباً وإياباً في نهاية المطاف إلى حدوث اختناق في عملية الحوسبة، ما يحد من السرعة التي يمكن لوحدات المعالجة الرسومية أن تُشغّل بها خوارزميات التعلم العميق.

مقر شركة نيورال ماجيك.
مصدر الصورة: نيورال ماجيك

في السنوات الأخيرة، نشأت عشرات الشركات التي تهدف لتصميم شرائح ذكاء اصطناعي يمكنها التغلب على هذه المشاكل، إلا أن المأزق الرئيسي تمثل في أنه كلما كانت الأجهزة أكثر تخصصاً، أصبحت أكثر تكلفة.

لذا، تعتزم نيورال ماجيك كسر هذه القاعدة، وبدلاً من إصلاح الأجهزة نفسها، أجرت الشركة تعديلات على البرمجيات. كما أعادت تصميم خوارزميات التعلم العميق لتعمل بكفاءة أكبر على وحدة المعالجة المركزية، عن طريق الاستفادة من الذاكرة الكبيرة المتوافرة في الشرائح والنوى المركبة الموجودة بها. وبالرغم من أن هذا النهج يُضعف السرعة التي تولدها عملية التوازي داخل وحدة المعالجة الرسومية، إلا أنه يستعيد نفس المقدار من الوقت تقريباً من خلال إلغاء الحاجة إلى نقل البيانات إلى داخل وخارج الشريحة. وتقول الشركة إن الخوارزميات يمكن أن تعمل على وحدات المعالجة المركزية “بنفس السرعات التي تعمل بها على وحدات المعالجة الرسومية”، ولكن بجزء بسيط من التكلفة. ويقول طومسون: “يبدو أن ما فعلوه هو إيجاد طريقة للاستفادة من ذاكرة وحدة المعالجة المركزية بطريقة لم يسبقهم إليها أحد من قبل”.

وتعتقد نيورال ماجيك أن ثمة بضعة أسباب ربما تقف وراء عدم اتباع هذا النهج من قبل. أولاً، أنه ليس أمراً بديهياً، ففكرة أن التعلم العميق يحتاج إلى أجهزة متخصصة هي فكرة راسخة لدرجة تجعل التغاضي عن النُهُج الأخرى أمراً بالغ السهولة. ثانياً، أن تطبيق الذكاء الاصطناعي في الصناعة لا يزال جديداً نسبياً، وقد بدأت الشركات للتو في البحث عن طرق أسهل لنشر خوارزميات التعلم العميق. ولكن لا يزال من غير الواضح ما إذا كان الطلب قوياً بما فيه الكفاية لكي تنطلق نيورال ماجيك. وتجري الشركة اختبارات تجريبية لمنتجها بالتعاون مع حوالي 10 شركات، لا تمثل سوى شريحة صغيرة من صناعة الذكاء الاصطناعي الأوسع نطاقاً.

“لا نريد تحسين الشبكات العصبونية فحسب، وإنما تحسين الحوسبة أيضاً بشكل عام”.
– نيل طومسون –

 

توفر تقنية نيورال ماجيك حالياً تنفيذ مهام الاستدلال في الرؤية الحاسوبية، ومع ذلك فإنه لا يزال يتعين على العملاء تدريب نماذجهم على أجهزة متخصصة، ثم يمكنهم بعد ذلك استخدام برمجيات الشركة لتحويل النموذج المُدرَّب إلى تنسيق متوافق مع وحدة المعالجة المركزية. ويقول شافيت إن أحد العملاء، وهو مصنع كبير لمعدات الفحص المجهري، يجرب حالياً هذا النهج لإضافة قدرات ذكاء اصطناعي مُدمجة إلى المجاهر. ونظراً لأن المجاهر مزودة بالفعل بوحدات معالجة مركزية، فإنها لن تحتاج إلى أي أجهزة إضافية. وعلى النقيض من ذلك، يتطلب استخدام نموذج تعلم عميق معتمد على وحدة المعالجة الرسومية أن تكون المعدات أكبر حجماً وأكثر تعطشاً للطاقة.

ثمة عميل آخر يريد استخدام تقنية نيورال ماجيك لمعالجة تسجيلات كاميرات المراقبة، وهو ما من شأنه تمكين الكاميرات من مراقبة الحركة داخل المبنى وخارجه باستخدام أجهزة الكمبيوتر المتوافرة بالفعل في الموقع. وبخلاف ذلك، فإنها قد تضطر إلى إرسال التسجيلات إلى السحابة الإلكترونية، ما قد يثير مشاكل تتعلق بالخصوصية، أو ستحتاج إلى استخدام أجهزة متخصصة لكل مبنى تراقبه.

ويقول شافيت إن الاستدلال هو البداية فقط؛ إذ تُخطط الشركة لتوسيع نطاق خدماتها في المستقبل لمساعدة الشركات على تدريب نماذج الذكاء الاصطناعي الخاصة بها على وحدات المعالجة المركزية أيضاً. ويضيف: “نعتقد أن وحدات المعالجة المركزية ستمثل المكون الفعلي لتشغيل خوارزميات التعلم الآلي بعد 10 إلى 20 عاماً من الآن”.

بيد أن طومسون يبدى تشككه في هذا الأمر؛ إذ يقول إن “الجوانب الاقتصادية الخاصة بإنتاج الشرائح تغيرت بالفعل، وهو ما سيؤدي إلى المزيد من التخصص”. علاوة على ذلك، بالرغم من أن الأجهزة الموجودة حالياً تحقق أداءً أفضل بفضل تقنية نيورال ماجيك، إلا أن إدخال تطورات أساسية على الأجهزة ستظل الطريقة الوحيدة لمواصلة دفع عملية الحوسبة إلى الأمام. ويضيف: “تبدو هذه وكأنها طريقة جيدة حقاً لتحسين الأداء في الشبكات العصبونية، لكننا لا نريد تحسين الشبكات العصبونية فحسب، وإنما تحسين الحوسبة أيضاً بشكل عام”.