Article image
أعاد نموذج (StyleGAN2) إنشاء هذه الصور الفنية بعد تدريبه على أقل من 1500 صورة من مقتنيات متحف متروبوليتان للفنون.
الصورة الأصلية: إنفيديا | تعديل: إم آي تي تكنولوجي ريفيو العربية



تقول الشركة إن نهج (تعزيز التمييز التكيفي‎) يقلل عدد الصور المطلوبة للتدريب بما بين 10 إلى 20 مرة، ومع ذلك فإنه يحقق نتائج رائعة.

بقلم

2020-12-09 18:05:47

09 ديسمبر 2020

نموذج إنفيديا يصنع أعمالاً فنية

أعلنت شركة إنفيديا أنها طورت نهجاً جديداً لتدريب نماذج الذكاء الاصطناعي باستخدام قدر ضئيل للغاية من البيانات، بحيث تتمكن من تعلم مهارات معقدة مثل محاكاة لوحات فنية شهيرة وإعادة إنشاء صور للأنسجة السرطانية.

وأشارت الشركة، على مدونتها، إلى أنها قدمت ورقة بحثية تشرح فيها التفاصيل الخاصة بتقنيتها الجديدة إلى المؤتمر السنوي لأنظمة معالجة المعلومات العصبونية (NeurIPS)، الذي يُعقد بين يومي 6 و12 ديسمبر الجاري.

وأضافت أنها طبقت النهج الجديد -المُسمى تعزيز التمييز التكيفي‎ (adaptive discriminator augmentation)– على نموذجها الشهير (NVIDIA StyleGAN2)، وأوضحت أنه تمكن من توليد أعمال فنية جديدة استناداً إلى أقل من 1500 صورة لأعمال فنية موجودة في متحف متروبوليتان للفنون بمدينة نيويورك.

ماذا تعني الشبكات التوليدية التنافسية؟

في البداية، تجدر الإشارة إلى مصطلح ضروري لفهم هذا الخبر، ألا وهو الشبكات التوليدية التنافسية Generative Adversarial Networks (GANS)، وهي تقنية ذكاء اصطناعي وإحدى أنواع الشبكات العصبونية الاصطناعية. وفيها تعمل شبكتان عصبونيتان معاً، أو بالأحرى: تعملان بشكل متعاكس. ويبدأ عمل الشبكات التوليدية التنافسية بتلقيم كلتا الشبكتين كمية كبيرة من بيانات التدريب وإعطاء كل منهما مهمة مستقلة؛ حيث تقوم الشبكة الأولى -المعروفة باسم: المولِّد- بإنتاج خرج مصطنع، مثل الكتابة بخط اليد أو الفيديوهات أو الأصوات، وذلك بدراسة بيانات التدريب ومحاولة تقليدها.

أما الشبكة الأخرى -المعروفة باسم الحَكَم- فتقوم بتحديد ما إذا كان الخرج حقيقياً عن طريق مقارنته في كل مرة مع نفس بيانات التدريب. وفي كل مرة تنجح فيها الشبكة الحكم برفض خرج الشبكة المولد، تعود الشبكة المولد إلى المحاولة مرة أخرى. وتسمح هذه التقنية للحواسيب بالتعلم بشكل فعال من البيانات التي لا تحمل علامات دلالية، ويمكن استخدامها لتشكيل صور ومقاطع فيديو واقعية الشكل.

كان نموذج (StyleGAN) الأولي عبارة عن شبكة توليدية تنافسية قدمها باحثو إنفيديا عام 2018 واستخدموها لإنتاج صور لوجوه بشرية مزيفة. وفي فبراير 2019، استخدم مهندس البرمجيات السابق في شركة أوبر، فيليب وانج، النموذج لإنشاء موقع “This Person Does Not Exist” – أي (هذا الشخص غير موجود)- الذي يوّلد وجوها جديدة متغيرة في كل مرة يتم فيها إعادة تحميل الموقع. وقد أعلنت الشركة عن الإصدار الثاني من النموذج في 5 فبراير 2020.

بيانات تدريب محدودة ونتائج رائعة

أوضحت إنفيديا أن نهج تعزيز التمييز التكيفي-الذي وصفته بالإنجاز الكبير- يقلل عدد الصور المطلوبة للتدريب بما بين 10 إلى 20 مرة، ومع ذلك فإنه يتمكن من تحقيق نتائج رائعة. وأضافت أن هذا النهج ربما يلعب في المستقبل دوراً هاماً في قطاع الرعاية الصحية، على سبيل المثال من خلال إنشاء صور للأنسجة السرطانية للمساعدة في تدريب نماذج الذكاء الاصطناعي الأخرى.

وترجع أهمية هذا النهج إلى أنه قد يساهم في حل الأزمة التي تواجهها الشبكات التوليدية التنافسية عادة بسبب قلة أعداد صور التدريب؛ إذ تحتاج إلى ما بين 50 ألف و100 ألف صورة للخروج بنتائج معقولة. وفي حالة عدم توافر البيانات الكافية، تقع الشبكة في مشكلة تدعى فرط التخصيص (overfitting)، التي تعني أنها تخفق في الوصول إلى نتائج واقعية.

وللتغلب على هذه المشكلة، كان باحثو الذكاء الاصطناعي يعمدون إلى إنشاء نسخ “مشوهة” من صور التدريب المتاحة عن طريق قص الصورة أو تدويرها، بحيث تصبح جديدة بالنسبة للشبكة. بيد أن مشكلة هذا النهج هي أنه كان يدفع الخوارزمية أحياناً لتقليد تلك التشوهات التي تدربت عليها.

وتقول إنفيديا إن نهجها الجديد يعتمد على تطبيق “عمليات زيادة البيانات بشكل تكيفي، ما يعني أن مقدار زيادة البيانات يتم تعديله في نقاط مختلفة في عملية التدريب، لتجنب مشكلة فرط التخصيص”.

وبالتالي، يمكن استخدام هذا النهج في الحالات التي تكون فيها البيانات نادرة للغاية، أو يصعب الحصول عليها أو تستغرق وقتاً طويلاً لتجميعها. على سبيل المثال، يُعد تدريب خوارزمية على اكتشاف اضطراب دماغي عصبي نادر أمراً صعباً بسبب ندرة البيانات التدريبية المتاحة. ومع ذلك، يمكن لشبكة توليدية تنافسية مدربة باستخدام نهج تعزيز التمييز التكيفي التغلب على هذه المشكلة، لأنها ستحتاج إلى أعداد أقل بكثير من الصور للتدريب عليها.

كما سيتيح هذا النهج للأطباء والباحثين مشاركة نتائجهم بسهولة أكبر لأنهم يعملون باستخدام قاعدة صور صُنعت بواسطة الذكاء الاصطناعي، وليست صور المرضى الحقيقيين، وبالتالي فلن تُثار أي مخاوف تتعلق بالخصوصية.

 

شارك