content_cookies111:string(1923) "{"id":23958,"content_cookies":null,"user_header":{"SERVER_SOFTWARE":"Apache\/2.4.52 (Debian)","REQUEST_URI":"\/%D9%86%D8%B8%D8%A7%D9%85-%D8%B0%D9%83%D8%A7%D8%A1-%D8%A7%D8%B5%D8%B7%D9%86%D8%A7%D8%B9%D9%8A-%D9%85%D8%AA%D8%B9%D8%AF%D8%AF-%D8%A7%D9%84%D9%84%D8%BA%D8%A7%D8%AA-%D9%81%D9%8A%D8%B3%D8%A8%D9%88%D9%83\/","REDIRECT_STATUS":"200","HTTP_X_FORWARDED_PROTO":"https","HTTP_CONNECTION":"upgrade","HTTP_HOST":"technologyreview.ae","HTTP_CF_CONNECTING_IP":"44.192.254.173","HTTP_CF_IPCOUNTRY":"US","HTTP_ACCEPT_ENCODING":"gzip","HTTP_CF_RAY":"810dea5fed338029-IAD","HTTP_CF_VISITOR":"{\\\"scheme\\\":\\\"https\\\"}","HTTP_USER_AGENT":"CCBot\/2.0 (https:\/\/commoncrawl.org\/faq\/)","HTTP_ACCEPT":"text\/html,application\/xhtml+xml,application\/xml;q=0.9,*\/*;q=0.8","HTTP_ACCEPT_LANGUAGE":"en-US,en;q=0.5","HTTP_CDN_LOOP":"cloudflare","PATH":"\/usr\/local\/sbin:\/usr\/local\/bin:\/usr\/sbin:\/usr\/bin:\/sbin:\/bin","SERVER_SIGNATURE":"Apache\/2.4.52 (Debian) Server at technologyreview.ae Port 80<\/address>\n","SERVER_NAME":"technologyreview.ae","SERVER_ADDR":"172.18.0.22","SERVER_PORT":"80","REMOTE_ADDR":"44.192.254.173","DOCUMENT_ROOT":"\/var\/www\/html","REQUEST_SCHEME":"http","CONTEXT_PREFIX":"","CONTEXT_DOCUMENT_ROOT":"\/var\/www\/html","SERVER_ADMIN":"webmaster@localhost","SCRIPT_FILENAME":"\/var\/www\/html\/index.php","REMOTE_PORT":"48806","REDIRECT_URL":"\/\u0646\u0638\u0627\u0645-\u0630\u0643\u0627\u0621-\u0627\u0635\u0637\u0646\u0627\u0639\u064a-\u0645\u062a\u0639\u062f\u062f-\u0627\u0644\u0644\u063a\u0627\u062a-\u0641\u064a\u0633\u0628\u0648\u0643\/","GATEWAY_INTERFACE":"CGI\/1.1","SERVER_PROTOCOL":"HTTP\/1.1","REQUEST_METHOD":"GET","QUERY_STRING":"","SCRIPT_NAME":"\/index.php","PHP_SELF":"\/index.php","REQUEST_TIME_FLOAT":1696427653.33686,"REQUEST_TIME":1696427653,"argv":[],"argc":0,"HTTPS":"on"},"user_ip":"44.192.254.173","user_agent":"CCBot\/2.0 (https:\/\/commoncrawl.org\/faq\/)"}"
هذه الميزة مخصصة للمشتركين يمكنهم مشاركة المواضيع بحد اقصى 10 مواد من كافة مواقع مجرة
تفاصيل خبر النموذج اللغوي الجديد للترجمة من فيسبوك
قررت فيسبوك أن تجعل نموذجها اللغوي الجديد الذي يعتمد على الذكاء الاصطناعي، M2M-100، مفتوح المصدر، ويستطيع هذا النموذج أن يترجم بين أي لغتين من مجموعة مؤلفة من 100 لغة. يوجد 4,450 تركيبة ممكنة من أزواج اللغات في هذه المجموعة، ويستطيع النموذج أن يتعامل مع 1,100 زوج منها بشكل مباشر. يعمل هذا النموذج بطريقة مختلفة عن النماذج السابقة متعددة اللغات، التي كانت تعتمد إلى درجة كبيرة على اللغة الإنجليزية كلغة وسيطة في عملية الترجمة. وعلى سبيل المثال، فإن الترجمة من الصينية إلى الفرنسية تتم عادة بالترجمة من الصينية إلى الإنجليزية ومن ثم من الإنجليزية إلى الفرنسية، وهو ما يزيد احتمال وقوع الأخطاء.
جمع البيانات
تم تدريب النموذج باستخدام 7.5 مليار زوج من الجمل. ومن أجل تجميع مجموعة بيانات بهذه الضخامة، اعتمد الباحثون إلى درجة كبيرة على عملية آلية. فقد استخدموا زواحف شبكة الويب (برامج تتصفح شبكة الإنترنت بطريقة منهجية وآلية منظمة) لاستخلاص المليارات من الجمل منها، واستخدموا نموذجاً لغوياً آخر يحمل اسم فاست تكست لتحديد اللغة. ومن الجدير بالذكر أن الشركة لم تستخدم أية بيانات من موقع فيسبوك. بعد ذلك، استخدم الباحثون برنامج ليزر 2.0 -الذي طُوِّر سابقاً في مختبر الأبحاث في فيسبوك، ويعتمد على التعليم غير الموجه، وهو نوع من التعلم الآلي الذي لا يحتاج إلى بيانات مصنفة يدوياً- لمطابقة الجمل من اللغات المختلفة عن طريق المعنى المشترك.
يقوم ليزر 2.0 ببناء ما يُعرف باسم "التضمينات" من مجموعات أضخم من بيانات الجمل الخام. ويقوم بالتدرب على أمثلة الجمل المتوافرة ضمن كل لغة، ويحدد العلاقات القائمة فيما بينها بناء على تكرارها وتقارب استخدامها. تساعد هذه التضمينات نموذج التعلم الآلي على تقريب معنى كل جملة، ما يسمح لليزر 2.0 بإجراء اقتران آلي بين كل جملتين تحملان نفس المعنى في لغتين مختلفتين.
سجل في نشرة الخوارزمية
ابق مواكباً لأحدث أخبار وتطبيقات الذكاء الاصطناعي في قطاعك، وتأثيراته المستقبلية على مجال عملك.
تم الإشتراك بنجاح !هناك خطأ ما, حاول مجدداً
اقتران اللغات
ركز الباحثون على تراكيب أزواج اللغات التي يعتقدون أنها ستكون الأكثر طلباً من قِبل المستخدمين. فقاموا بتجميع اللغات وفقاً للتشابهات اللسانية والجغرافية والثقافية، مع افتراض وجود تواصل أكبر بين الناس الذين يعيشون في نفس المنطقة. وتتضمن واحدة من المجموعات، على سبيل المثال، أكثر اللغات شيوعاً في الهند، بما فيها البنغالية والهندية والتاميلية والأوردو. قام ليزر 2.0 بعد ذلك بتركيز بحثه على أزواج الجمل التي تنتمي إلى جميع أزواج اللغات ضمن كل مجموعة.
تحديات مستمرة
ما زالت بعض اللغات، مثل اللغات الأفريقية ولغات جنوب شرق آسيا، تعاني من بعض المشاكل في جودة الترجمة، وذلك بسبب قلة بياناتها التي يمكن استخلاصها من الويب، وذلك وفقاً لأنجيلا فان، الباحثة الأساسية في المشروع. ونظراً لاعتماد البحث على بيانات الويب، يحتاج الباحثون أيضاً إلى التوصل لطرق تحديد وحذف التحيزات على أساس الجنس والعرق وغير ذلك. حالياً، استخدم الباحثون مرشحاً للكلمات البذيئة لتشذيب بعض اللغات ذات الطابع الفاضح، ولكن أثره محصور بشكل أساسي في اللغة الإنجليزية.
للأغراض البحثية فقط
لا تخطط فيسبوك حالياً لاستخدام النموذج في منتجاتها. وتقول فان إن M2M-100 مخصص فقط للأغراض البحثية. ولكن، في المحصلة، فإن الهدف من النموذج هو تحسين وتوسيع قدرات فيسبوك الحالية في الترجمة. ويمكن أن تتضمن التطبيقات تواصل المستخدمين (مثل الميزة التي تسمح للمستخدمين بترجمة المنشورات إلى لغاتهم المحلية) وربما مراقبة المحتوى.
كارين هاو هي مراسلة الذكاء الاصطناعي في إم آي تي تكنولوجي ريفيو. وهي تقوم على وجه الخصوص بتغطية التأثيرات الأخلاقية والاجتماعية لهذه التكنولوجيا، بالإضافة إلى تطبيقاتها في خدمة الصالح … المزيد الاجتماعي.
نستخدم ملفات تعريف الارتباط لتحسين تجربتك، استمرار استخدامك للموقع يعني موافقتك على ذلك. سياسة الخصوصيةأوافقX
Privacy & Cookies Policy
Privacy Overview
This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.