العملاق الصيني يرد: بايدو تطلق بوت دردشة منافساً لتشات جي بي تي

7 دقائق
العملاق الصيني يرد: بايدو تطلق بوت دردشة منافساً لتشات جي بي تي
حقوق الصورة: shutterstock.com/ Koshiro K

منذ فترة وجيزة، صعد أحد مؤسسي شركة بايدو (Baidu) ورئيسها التنفيذي، روبن لي، إلى منصة المسرح في بكين لاستعراض النموذج اللغوي الجديد من الشركة، إرني بوت (Ernie Bot). وفي عرض مزين بأعمال فنية من إنتاج نظام ذكاء اصطناعي لتوليد الصور من بايدو، استعرض "لي" أمثلة عن قدرات بوت الدردشة، بما في ذلك حل المسائل الرياضية، وكتابة النصوص التسويقية، والإجابة عن الأسئلة حول الأدب الصيني، وتوليد إجابات متعددة الوسائط.

وكانت بايدو تخطط منذ أشهر لهذا الإعلان عن منتجاتها في وسط مارس/ آذار. ولكنها فوجئت بإعلان غير متوقع من أوبن أيه آي (OpenAI) لجي بي تي 4 (GPT-4)، الذي أصبح بوضوح نقطة مقارنة مرجعية لجميع من يراقبون نشاطات بايدو، بمن فيهم الرئيس التنفيذي نفسه. "يتوقع الجميع مقارنة إرني بوت مع تشات جي بي تي، أو حتى جي بي تي 4، وهو معيار مرتفع للغاية"، كما قال "لي" في بداية عرضه التقديمي.

إرني بوت: بوت الدردشة الجديد من بايدو

وكما هو متوقع، فإن إرني بوت (وهو اسم مختصر يجمع الأحرف الأولى الإنجليزية المقابلة لكلمات العبارة: التمثيل المحسّن من تكامل المعرفة، أما اسمه الصيني فهو وينشين يي يان "文心一言") يقدم أداء جيداً للغاية في المهام المتعلقة بالثقافة الصينية، مثل شرح الوقائع التاريخية أو كتابة القصائد الشعرية التقليدية. ويقول "لي" إن بايدو، بوصفها شركة صينية، "يجب أن تقدم أداء أفضل من نموذج لغوي كبير مدرب مسبقاً" من حيث فهم اللغة الصينية.

ولكن أهم نقطة في هذا الإعلان عن المنتج كانت ميزة الخرج المتعدد الأنماط لبوت الدردشة إرني بوت، وهي غير موجودة في تشات جي بي تي أو جي بي تي 4 (من الجدير بالذكر أن أوبن أيه آي كانت قد تفاخرت بقدرة جي بي تي 4 على تحليل صورة محتويات ثلاجة وتقديم عدة اقتراحات لوصفات طهي مختلفة، ولكن النموذج قادر على توليد النصوص فقط). عرض "لي" تفاعلاً مسجلاً مع البوت حيث قام بتوليد صورة توضيحية لنظام نقل مستقبلي للمدن، كما استخدم اللغة الصينية لقراءة إجابة نصية، وقام بتعديل مقطع فيديو وإضافة الحواشي النصية إليه بناء على النص نفسه. ولكن، وفي اختبار لاحق أُجري بعد الإعلان، لم تتمكن إحدى المجلات الصينية من إعادة إنتاج عملية توليد الفيديو.

اقرأ أيضاً: ما هو «جي بي تي-4»؟ ولماذا قد يمثل علامة فارقة في تاريخ الذكاء الاصطناعي؟

لقد كان عامة الصينيين متشوقين للحصول على بديل لتشات جي بي تي، فقد قامت كل من أوبن أيه آي والحكومة الصينية بحظر استخدام بوت الدردشة الأميركي من قبل الأفراد الصينيين.

ولكن، وحتى الآن، فإن استخدام إرني بوت متاح فقط لمجموعة صغيرة للغاية ومختارة بدقة من منتجي المحتوى الصينيين. ويمكن للشركات تقديم طلب الوصول إلى البوت عبر واجهة برمجة التطبيقات. ولكن بايدو لم تصرح عن إمكانية إتاحة استخدام هذه التكنولوجيا للمستهلكين. كما أنه ليس من الواضح ما إذا كانت الشركة ستقوم بدمجه في منتجاتها الأخرى، مثل محرك البحث الخاص بها أو سياراتها الذاتية القيادة، كما وعدت الشركة.

ومقارنة مع إطلاق تشات جي بي تي وجي بي تي 4، فقد بدا إطلاق إرني بوت مستعجلاً بعض الشيء. فلم يتضمن العرض التقديمي أي عرض تجريبي مباشر، واقتصر على عرض خمس جلسات مسجلة مسبقاً. كما قال "لي"، وبشكل متكرر، إن إرني ما زال غير مثالي، وسيتحسن ما إن ينتشر إلى عدد أكبر من المستخدمين. أما أسعار أسهم بايدو فقد انخفضت بنسبة 6.4% بعد ذلك بفترة وجيزة، كما أن وسائل التواصل الاجتماعي ضجت بالانطباعات السلبية المعبرة عن خيبة الأمل.

ولكن "لي" بدا مستعداً لردة فعل كهذه. "لقد كان الجميع يسألونني منذ فترة: لماذا قررتم إطلاق إرني بوت بهذه السرعة؟ هل أنتم مستعدون لهذا؟"، كما قال خلال عرضه التقديمي. "وفقاً لما رأيته شخصياً في أثناء إجراء الاختبارات الداخلية على إرني بوت، فإنه غير مثالي. ولكن، ما الذي يدفعنا لإطلاقه الآن؟ لأن السوق تتطلب ذلك".

اقرأ أيضاً: كيف تسعى أوبن أيه آي إلى جعل تشات جي بي تي أكثر أماناً وأقل تحيزاً؟

السباق نحو المرتبة الأولى

على الرغم من إطلاق بضعة بوتات على شاكلة تشات جي بي تي من قبل الشركات الصينية والباحثين الصينيين، فقد فشلت جميعها في تقديم نتائج مرضية. إذ قوبل موس (MOSS)، وهو بوت دردشة باللغة الإنجليزية من تصميم باحثي جامعة فودان في شنغهاي، بحجم هائل من طلبات الاستخدام، لدرجة أن خادمه الحاسوبي انهار بعد يوم واحد من إطلاقه في أواخر فبراير/ شباط. ولم يعد للعمل حتى الآن. أما مينيماكس (MiniMax)، وهي شركة ناشئة صينية، فقد أطلقت بوت دردشة باسم إنسبو (Inspo) في وقت سابق من هذا الشهر، ولكن من المشتبه أن ما فعلته ليس سوى تقديم لمنتج برمجي مبني على نموذج جي بي تي 3.5 الذي طورته أوبن أيه آي.

ويتوقع الكثيرون أن تكون بايدو أول شركة صينية تتمكن من مجاراة تشات جي بي تي. ففي 2019، أطلقت بايدو نموذج إرني 3.0 (Ernie 3.0) المكافئ لنموذج جي بي تي 3. كما أطلقت نموذجاً قوياً نوعاً ما لتحويل النصوص إلى صور باسم إرني فيلغ (Ernie ViLG) في السنة الماضية.

وتتمتع الشركة بعدة أفضليات تمكّنها من التميز عن باقي الشركات الصينية. فقد قامت بتصميم شريحتها الحاسوبية الخاصة بها لأغراض الذكاء الاصطناعي، كونلون (Kunlun)، التي تم استخدامها في تدريب نماذج إرني وتشغيلها، والتي يمكن أن تحمي الشركة من آثار التوتر المتنامي باستمرار بين الولايات المتحدة والصين حول أنصاف النواقل. كما أن الشركة قامت بتصميم محرك بحث، وموسوعة على الإنترنت، ومنتدى حواري، ومنصة نشر إعلامية منذ عام 2000، وبالتالي فإنها قادرة على الوصول إلى مواد التدريب باللغة الصينية من عدة مصادر خاصة بها.

ووفقاً لبيان بايدو الصحفي، فإن إرني بوت مدرب باستخدام "تريليونات من صفحات الويب، وعشرات المليارات من بيانات البحث والصور، ومئات المليارات من البيانات الصوتية اليومية، إضافة إلى بيان معرفي (knowledge graph) يتضمن 550 مليار معلومة".

وعند إطلاق البرنامج، قارن "لي" شركة بايدو بالشركات التكنولوجية الكبيرة الغربية، حيث يقول: "يمكنني القول إن بايدو تعتبر من أوائل الشركات التكنولوجية العملاقة الدولية التي تطلق بديلاً تم تطويره داخلياً لتشات جي بي تي. إن مايكروسوفت (Microsoft) تعتمد على إمكانية الوصول إلى أوبن أيه آي. أما جوجل (Google) وميتا (Meta) وأمازون (Amazon) فلم تقم أي منها بإطلاق منتج من النوع نفسه وعلى المستوى نفسه".

اقرأ أيضاً: في خطوة اضطرارية: جوجل تطلق بارد رداً على تشات جي بي تي

المقارنة الحتمية مع جي بي تي 4

مع إطلاق جي بي تي 4 مؤخراً، ليس من المفاجئ أن يقارن الجميع بين النظامين. ولكن هذه المقارنة ليست سهلة، فالشركتان حريصتان على إخفاء التفاصيل التقنية لبوتات الدردشة الخاصة بهما.

وعلى غرار أوبن أيه آي، فقد قررت بايدو أيضاً ألا تكشف عن عدد المعاملات الموجودة في أحدث إصدار من إرني. وعادة ما يُعتَبَر عدد المعاملات الوسيطة في النموذج مؤشراً على قدرات هذا النموذج. ولكن الأرقام للمنتجات من الجيل السابق متاحة للجميع: فنظام جي بي تي 3 الذي أطلقته أوبن أيه آي في يونيو/ حزيران من العام 2020 يحتوي على 175 مليار معامل وسيط، أما إرني 3.0 تيتان، الذي أطلقته بايدو في ديسمبر/ كانون الأول من العام 2021 فيحتوي على 260 مليار معامل وسيط.

وعلى الرغم من أن إرني بوت لا يستطيع تحليل الصور مثل جي بي تي 4، فإنه يقدم خيارات أخرى للخرج. ففي العرض التقديمي، قام بوت الدردشة بقراءة نص الإجابة بلهجة سيشوان، وهي لهجة شائعة الانتشار في جنوب غرب الصين. كما قال "لي" إن النموذج قادر على توليد الصوت بعدة لهجات صينية أخرى، مثل لهجات كانتون وهوكين ودونغبي.

ولكن جودة الإجابات التي يقدمها قد تكون مسألة أخرى تماماً. ففي بث مباشر بعد الإطلاق، قامت مجلة إكس بين (X.Pin) التكنولوجية الصينية بتوجيه بعض من الأسئلة نفسها بالصينية إلى إرني بوتي وجي بي تي 4. وعلى حين تمكنت تكنولوجيا بايدو من الإجابة عن معظم الأسئلة بصورة مترابطة، فقد ارتكبت عدداً أكبر من الأخطاء. وقد واجهت صعوبة في الإجابة بشكل صحيح عن بعض الأسئلة العامة حول التاريخ الصيني، وتذكّر السياق الذي تم توجيه الأسئلة وفقه، وتوليد مجموعة تعليمات برمجية لبناء لعبة صغيرة. كما لم يتمكن المدققون من اختبار قدرة توليد الفيديو. فقد رفض إرني بوت القيام بهذا، قائلاً إنه يحتاج إلى بعض الوقت لتحرير البيانات ومعالجتها.

الاستعجال لتلبية طلب شركاء الأعمال

أفادت صحيفة وول ستريت جورنال (Wall Streel Journal) أن الشركة اتخذت عدة إجراءات كي يصبح إرني بوت جاهزاً ليوم الإطلاق الكبير، فقد طلبت من موظفيها العمل في أيام العطل الرسمية، ووظفت المزيد من المتعاقدين لمراجعة إجابات البوت، وحشدت بعض الموارد، مثل شرائح الحوسبة A100 من إنفيديا (Nvidia)، التي كانت موجودة لدى فرق الذكاء الاصطناعي الأخرى في الشركة.

اقرأ أيضاً: كيف غيّر «تشات جي بي تي» نظرة العالم إلى الذكاء الاصطناعي؟

ومنذ ذلك الحين، ظهرت عدة دلائل أخرى تشير إلى أن بوت الدردشة لم يكن جاهزاً للاستخدام على نطاق واسع. فقد قالت بايدو من قبل إنها ستقوم بدمج إرني في العديد من منتجات الشركة، بما فيها سياراتها الذاتية القيادة، ومنتجها الأساسي، محرك البحث. ولكن إطلاق هذا المنتج لم يتضمن أياً من هذه التطبيقات، أو أي شرح عن كيفية تنفيذ هذا الدمج.

وقد شعر الكثير من المراقبين بالخيبة لأن حدث الإطلاق لم يتضمن سوى مقاطع فيديو مسجلة مسبقاً حول محاولات التفاعل مع بوت الدردشة، حيث يمكن بسهولة اختيار ما يناسب الشركة من هذه المقاطع، أو حتى تعديلها. كما أشار البعض إلى أن الكثير من الوظائف المتعددة الوسائط التي تم استعراضها في العرض التقديمي موجودة من قبل في أدوات الذكاء الاصطناعي الحالية لدى بايدو، مثل نظام الذكاء الاصطناعي لإنشاء الصور من العام 2022 أو أداة تحرير الفيديو التي أطلقتها الشركة في 2020، ما يعني أن الابتكار يتمثل في دمجها ضمن واجهة واحدة سهلة الاستخدام.

وعلى حين قامت بايدو بتطوير عدة أنواع مختلفة من نماذج الذكاء الاصطناعي على مر السنوات، فإن إرني بوت يبدو أقرب إلى طريقة لتجميع قدرات الشركة الحالية بصورة تتيح للمستخدمين التجاريين اعتمادها بصورة أكثر سهولة.

ويبدو من الواضح أن العملاء من الشركات الكبيرة هم الهدف الحقيقي لهذا الحدث، لا العامة. حيث قال "لي" خلال عرضه التقديمي: "لن يقتصر تأثير إرني بوت على محركات البحث وشركات الإنترنت، بل سيؤثر على جميع الشركات، فإرني بوت سوف يجعل الشركات وعملاءها أكثر تقارباً".

اقرأ أيضاً: ما هي قوة المعالجة والعتاد الصلب المستخدمان في تشغيل تشات جي بي تي؟

ووفقاً لبايدو، فقد سجلت 650 شركة اشتراكها لاستخدام تكنولوجيا إرني بوت قبل إطلاقها، كما قدمت أكثر من 30,000 شركة طلبات لاستخدام واجهة برمجة التطبيقات منذ تاريخ تنظيم حدث الإطلاق. وتشير التقارير الإخبارية السابقة إلى أن الشركات التي أبدت اهتمامها باستخدام بوت الدردشة تتضمن شركة تصنيع الحواسيب لينوفو (Lenovo) ومنصة السفر تريب دوت كوم (Trip.com) وعدة شركات سيارات صينية. وعلى الرغم من عدم وجود أي مؤشرات على طبيعة هذه الشراكات، فمن المرجح أن نعرف المزيد مع إطلاق بايدو لواجهة برمجة التطبيقات خلال الأشهر المقبلة.