سام ألتمان: هذا ما تعلّمته من نموذج دال- إي 2 (DALL-E 2)

سام ألتمان: هذا ما تعلّمته من برنامج دال- إي 2 (DALL-E 2)

مصدر الصورة: غيتي إيميدجيز.

استمع الى المقالة الآن هذه الخدمة تجريبية

كان الرئيس التنفيذي لشركة أوبن أيه آي (OpenAI)، سام ألتمان، المحرّك الأساسي للشركة التي تتخذ من سان فرانسيسكو مقراً لها، منذ أن شارك في تأسيسها مع إيلون ماسك وداعمين آخرين في عام 2015. حيث تُشكّل رؤيته لمستقبل الذكاء الاصطناعي وسُبل تحقيقه كل ما تقوم به الشركة، كما تُحدد الاتجاه الذي تسلكه أبحاث الذكاء الاصطناعي بشكلٍ عام. قامت شركة أوبن أيه آي (OpenAI) بتدشين عصر النماذج اللغوية الكبيرة من خلال إطلاقها لنموذج جي بي تي- 3 (GPT-3) في عام 2020. وفي هذا العام، مع إطلاق نموذجها التوليدي لصناعة الصور دال- إي 2 (DALL-E 2)، فقد وضعت أجندة جديدة للذكاء الاصطناعي.

حيث فتح نموذج دال- إي 2 (DALL-E 2) المجال أمام الإبداع والابتكار، ولا يزال ذلك مستمراً. وسرعان ما ظهرت نماذج أخرى أفضل أو مجانية للاستخدام والتعديل. لكن نموذج دال- إي 2 (DALL-E 2) كان هو نقطة البداية، وأول نجاح باهر سيترك بصمة ليس فقط على الذكاء الاصطناعي، ولكن على المجتمع والثقافة السائدة لسنوات قادمة. لكن يعترف ألتمان بأن هذا التأثير ليس إيجابياً بالكامل.

تحدثتُ إلى ألتمان حول ما تعلّمه من نموذج دال- إي 2 (DALL-E 2). حيث يقول: “أعتقد أن هناك مجموعة مهمة من الدروس المستفادة، حول شكل الذكاء الاصطناعي في العقد القادم”.

تم تعديل هذه المقتطفات من الحوار من أجل الوضوح والإيجاز، وإليكم إجابات سام ألتمان:

لماذا أحدثَ نموذج دال- إي 2 (DALL-E 2) هذا التأثير؟

لقد تجاوز النموذج التوقعات، حيث يمكنه أن يولّد صوراً واقعية. ولكن حتى مع الصور غير الواقعية، يبدو أن هذا البرنامج يدرك المفاهيم جيداً لدمج الأشياء بطرائق جديدة تبدو وكأنها ذكاء حقيقي. وهذا الشيء لم يحدث في برنامج دال- إي 1 (DALL-E 1).

لكنني أقول إن المجتمع التكنولوجي كان معجباً بنموذج جي بي تي- 3 (GPT-3) في عام 2020 أكثر من نموذج دال- إي (DALL-E). حيث كان نموذج جي بي تي- 3 (GPT-3) أول تجربة نشعر فيها بالذكاء الاصطناعي. إذ يمكنه أن يحاكي سلوك الإنسان. كما أعتقد أنه جعل الأشخاص الذين لم يؤمنوا في السابق بالذكاء الاصطناعي العام، يأخذوا ذلك الأمر بجدّيّة أكبر. كان هناك ثمّة شيء يحدث لم يتوقعه أحدٌ منّا.

لكن الصور لها قوة عاطفية. لذا، فقد كانت بقية العالم أكثر إعجاباً بنموذج دال- إي (DALL-E) من نموذج جي بي تي- 3 (GPT-3).

ما الدروس التي تعلّمتها من نجاح نموذج دال- إي 2 (DALL-E 2)؟

أعتقد أن هناك مجموعة مهمة من الدروس المستفادة، حول شكل الذكاء الاصطناعي في العقد القادم. أوّلها هو مصدر الفكرة: فريق من ثلاثة أشخاص يدرسون هذه الفكرة في زاوية في مبنى شركة أوبن أيه آي (OpenAI).

هذه الفكرة الوحيدة حول نماذج الانتشار، مجرد تقدُّم بسيط في الخوارزميات، حيث تحولنا من صنع شيء ليس جيداً إلى شيء يمكن أن يكون له تأثير كبير على العالم.

الشيء الآخر المثير للاهتمام هو أن هذا هو أول ذكاء اصطناعي يستخدمه الجميع، وهناك بعض الأسباب وراء ذلك. أحد هذه الأسباب هو أنه يقوم بصنع منتجات جاهزة وكاملة. إذا كنت تستخدم نموذج كوبايلوت (Copilot)، وهو أداة لتوليد الرموز البرمجية باستخدام الذكاء الاصطناعي، فهو يحتاج إلى مساعدتك بشكلٍ كبير. لكن الأمر مختلف مع دال- إي 2 (DALL-E 2)، فأنت تخبره بما تريد، ليكون الأمر أشبه بالتحدث إلى رسّام. وأعتقد أنها المرة الأولى التي نرى فيها هذا الأمر باستخدام الذكاء الاصطناعي.

ماذا يعني نموذج دال- إي (DALL-E) للمجتمع؟

عندما أدركنا أن نموذج دال- إي 2 (DALL-E 2) سيكون شيئاً عظيماً، أردنا أن يكون مثالاً على كيفية تطبيق التكنولوجيا الجديدة، وأن نجعل العالم يفهم أن الصور قد تكون مزيفة، لذلك يجب عدم الوثوق بالصور التي تُنشر على الإنترنت.

كما أردنا التحدث إلى الأشخاص الذين سيتأثرون سلباً أولاً، ونجعلهم يستخدمون النموذج . هذا ليس إطار العمل الحالي، لكننا نسعى للوصول إلى فكرة أنّه إذا كنت ستساعد في تدريب الذكاء الاصطناعي من خلال تقديم البيانات، فيجب أن تمتلك جزءاً من هذا النموذج بطريقةٍ ما.

لكن من المهم أن تكون واضحاً وصريحاً. سيؤثر هذا على سوق العمل للرسّامين. حيث سيرتفع حجم عمل الرسّام بمعدل 10 أضعاف أو 100 ضعف. من الصعب جداً تحديد مدى تأثير ذلك على سوق العمل. من الممكن أن يكون التأثير كبيراً أو محدوداً. ستكون هناك بالطبع وظائف جديدة باستخدام هذه الأدوات. ولكن سيكون هناك تغيير أيضاً.

في الوقت نفسه، هناك فائدة مجتمعية ضخمة، حيث سيحصل الجميع على هذه القوة الخارقة الجديدة. لقد استخدمتُ نموذج دال- إي 2 (DALL-E 2) في الكثير من الأشياء. لقد صنعتُ أعمالاً فنية ووضعتها في منزلي. وقد قمت بإعادة تصميم منزلي، واستخدمتُ النموذج بنجاح في الأفكار المعمارية.

بعض أصدقائي متزوجون، حيث تحتوي كل زاوية صغيرة من مواقعهم على الإنترنت على صور تم إنشاؤها بواسطة نموذج دال- إي (DALL-E)، وجميع تلك الصور مهمّة للزوجين وتبدو كأنها حقيقية، لذلك لن يضطروا لتوظيف رسام للقيام بذلك.

وأخيراً، أردنا فقط استخدام نموذج دال- إي 2 (DALL-E 2) لنخبر العالم بأننا سنصنع ذكاءً اصطناعياً قوياً يشبه الإنسان في فهمه للعالم وقيامه بأشياء مفيدة. كما أننا نريد تثقيف الناس حول ما هو قادم حتى نتمكن من المشاركة في النقاشات المجتمعية.