content_cookies111:string(1926) "{"id":64998,"content_cookies":null,"user_header":{"SERVER_SOFTWARE":"Apache\/2.4.52 (Debian)","REQUEST_URI":"\/%D9%85%D9%8A%D8%AA%D8%A7-%D8%B7%D9%88%D8%B1-%D9%86%D9%85%D8%A7%D8%B0%D8%AC-%D8%AA%D8%AA%D8%B9%D8%B1%D9%81-%D8%B9%D9%84%D9%89-%D8%A3%D9%83%D8%AB%D8%B1-%D9%85%D9%86-%D8%A3%D9%84%D9%81-%D9%84%D8%BA%D8%A9\/","REDIRECT_STATUS":"200","HTTP_X_FORWARDED_PROTO":"https","HTTP_CONNECTION":"upgrade","HTTP_HOST":"technologyreview.ae","HTTP_CF_CONNECTING_IP":"44.200.101.84","HTTP_CF_IPCOUNTRY":"US","HTTP_ACCEPT_ENCODING":"gzip","HTTP_CF_RAY":"80aa79e8add32076-IAD","HTTP_CF_VISITOR":"{\\\"scheme\\\":\\\"https\\\"}","HTTP_USER_AGENT":"CCBot\/2.0 (https:\/\/commoncrawl.org\/faq\/)","HTTP_ACCEPT":"text\/html,application\/xhtml+xml,application\/xml;q=0.9,*\/*;q=0.8","HTTP_ACCEPT_LANGUAGE":"en-US,en;q=0.5","HTTP_CDN_LOOP":"cloudflare","PATH":"\/usr\/local\/sbin:\/usr\/local\/bin:\/usr\/sbin:\/usr\/bin:\/sbin:\/bin","SERVER_SIGNATURE":"Apache\/2.4.52 (Debian) Server at technologyreview.ae Port 80<\/address>\n","SERVER_NAME":"technologyreview.ae","SERVER_ADDR":"172.18.0.9","SERVER_PORT":"80","REMOTE_ADDR":"44.200.101.84","DOCUMENT_ROOT":"\/var\/www\/html","REQUEST_SCHEME":"http","CONTEXT_PREFIX":"","CONTEXT_DOCUMENT_ROOT":"\/var\/www\/html","SERVER_ADMIN":"webmaster@localhost","SCRIPT_FILENAME":"\/var\/www\/html\/index.php","REMOTE_PORT":"36674","REDIRECT_URL":"\/\u0645\u064a\u062a\u0627-\u0637\u0648\u0631-\u0646\u0645\u0627\u0630\u062c-\u062a\u062a\u0639\u0631\u0641-\u0639\u0644\u0649-\u0623\u0643\u062b\u0631-\u0645\u0646-\u0623\u0644\u0641-\u0644\u063a\u0629\/","GATEWAY_INTERFACE":"CGI\/1.1","SERVER_PROTOCOL":"HTTP\/1.1","REQUEST_METHOD":"GET","QUERY_STRING":"","SCRIPT_NAME":"\/index.php","PHP_SELF":"\/index.php","REQUEST_TIME_FLOAT":1695384956.322771,"REQUEST_TIME":1695384956,"argv":[],"argc":0,"HTTPS":"on"},"user_ip":"44.200.101.84","user_agent":"CCBot\/2.0 (https:\/\/commoncrawl.org\/faq\/)"}"
مصدر الصورة: ستيفاني أرنيت. إم آي تي تي آر. إنفاتو
إهداء هذه المقالة
هذه الميزة مخصصة للمشتركين يمكنهم مشاركة المواضيع بحد اقصى 10 مواد من كافة مواقع مجرة
صمم الخبراء في شركة ميتا نماذج ذكاء اصطناعي يمكنها التعرف على الكلام وتوليده في أكثر من ألف لغة، وهو عدد يساوي 10 أضعاف عدد اللغات المتوفرة في النماذج الحالية. تقول الشركة إن هذه الخطوة هي خطوة مهمة نحو الحفاظ على اللغات المعرضة لخطر الاختفاء.
تطلق شركة ميتا نماذجها عبر خدمة استضافة الرموز البرمجية غيت هاب (GitHub)، وتدّعي أن جعل هذه النماذج مفتوحة المصدر سيساعد المطورين الذين يعملون بلغات مختلفة على تصميم تطبيقات كلام جديدة مثل خدمات المراسلة التي تفهم اللغات جميعها، أو أنظمة الواقع الافتراضي التي يمكن استخدامها بأي لغة.
نماذج للحفاظ على اللغات المهددة بالانقراض
ثمة نحو 7 آلاف لغة في العالم؛ لكن نماذج التعرف على الكلام الحالية تعمل باستخدام نحو 100 لغة فقط على نحو شامل. يعود ذلك إلى أن هذه النماذج تتطلب كميات هائلة من بيانات التدريب الموسومة التي لا تتوفر إلا بعدد قليل من اللغات مثل الإنجليزية والإسبانية والصينية.
سجل في نشرة الخوارزمية
ابق مواكباً لأحدث أخبار وتطبيقات الذكاء الاصطناعي في قطاعك، وتأثيراته المستقبلية على مجال عملك.
تم الإشتراك بنجاح !هناك خطأ ما, حاول مجدداً
نجح باحثو شركة ميتا في حل هذه المشكلة من خلال إعادة تدريب أحد نماذج الذكاء الاصطناعي الحالية الذي طورته الشركة في عام 2020، وهو نموذج قادر على تعلّم أنماط الكلام من التسجيلات الصوتية من دون الحاجة إلى استخدام كميات كبيرة من البيانات الموسومة مثل النصوص المنقولة.
درب خبراء الشركة هذا النموذج باستخدام مجموعتين جديدتين من البيانات، تحتوي الأولى على تسجيلات صوتية لكتاب العهد الجديد والنصوص المقابلة للتسجيلات المأخوذ من الإنترنت والمكتوبة بـ 1107 لغات، بينما تحتوي الثانية على تسجيلات صوتية غير موسومة للكتاب نفسه بـ 3,809 لغات. عالج الفريق التسجيلات الصوتية والبيانات النصية لتحسين جودتها ثم شغّل خوارزمية مصممة لتوافق بين التسجيلات الصوتية والنصوص المرافقة لها، ثم كرروا العملية باستخدام خوارزمية أخرى تدرّبت على البيانات المتوافقة الجديدة. تمكن الباحثون بتطبيق هذه الطريقة من تدريب الخوارزمية على تعلم لغة جديدة بسهولة أكبر حتى من دون استخدام النص المرافق.
ويقول عالم الأبحاث في شركة ميتا، مايكل أولي (Michael Auli) الذي عمل في المشروع: "يمكننا استخدام ما تعلمه هذا النموذج لتصميم أنظمة الكلام بسرعة باستخدام كمية قليلة جداً من البيانات. لدينا الكثير من مجموعات البيانات العالية الجودة باللغة الإنجليزية، وكذلك الأمر بالنسبة إلى عدد قليل من اللغات الأخرى؛ ولكن ليست لدينا مجموعات بيانات عالية الجودة باللغات التي يتحدث بها عدد قليل من البشر (ألف شخص مثلاً)".
يقول الباحثون إن نماذجهم يمكن أن تتحدث بأكثر من ألف لغة ولكنها تتعرف على أكثر من 4 آلاف لغة. قارن الباحثون النماذج الجديدة مع تلك التي طورتها الشركات المنافسة؛ مثل نموذج ويسبر (Whisper) الذي طورته شركة أوبن أيه آي، وهم يزعمون أن معدل الأخطاء في نماذجهم يساوي نصف معدل الأخطاء في النماذج الأخرى، على الرغم من أنها تعمل بعدد من اللغات يبلغ 11 ضعفاً من عدد لغات هذه النماذج المنافسة.
مع ذلك، يحذّر الفريق من أن نموذجه ما يزال معرضاً لاحتمال ارتكاب الأخطاء في نقل كلمات أو عبارات معينة؛ ما قد يؤدي إلى توليد تسميات غير دقيقة أو أخرى قد تكون مسيئة. يعترف الباحثون أيضاً بأن نماذج التعرف على الكلام التي طوروها ولّدت عدداً من الكلمات المتحيزة أكبر من النماذج الأخرى بنسبة 0.7% فقط.
وعلى الرغم من أن نطاق هذا المجال البحثي مثير للإعجاب، يقول الباحث في منظمة ماساكانيه (Masakhane) التي تعمل في مجال معالجة اللغات الطبيعية للغات الإفريقية، كريس إيميزويه الذي لم يشارك في البحث الجديد، إن استخدام النصوص الدينية لتدريب نماذج الذكاء الاصطناعي يمكن أن يكون مثيراً للجدل.
ريانون ويليامز (Rhiannon Williams): تكتب نشرة ذا داونلود (The Download) الإخبارية، وهي النشرة الإخبارية الوحيدة التي يجدر بك قراءتها يومياً. وهي مراسلة إخبارية أيضاً، وقبل الانضمام إلى إم آي تي تكنولوجي ريفيو كانت مراسلة متخصصة بالتكنولوجيا في صحيفة … المزيد آي (i)، ومراسلة متخصصة بالتكنولوجيا في صحيفة ذا تيليغراف (The Telegraph). أدرج اسمها ضمن قائمة المرشحين النهائية لجائزة الصحافة البريطانية في 2021، وهي تظهر بصورة منتظمة بصفة خبيرة على قناة بي بي سي.
نستخدم ملفات تعريف الارتباط لتحسين تجربتك، استمرار استخدامك للموقع يعني موافقتك على ذلك. سياسة الخصوصيةأوافقX
Privacy & Cookies Policy
Privacy Overview
This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.