اشترك

الاستمرار بالحساب الحالي

شارك
شارك


دَرَّب مجموعة من الباحثين شبكةً عصبونيةً على تحويل "البصمات الصوتية" في مقطع مسموع من لغة إلى لغة أخرى.

2019-06-03 14:00:07

03 يونيو 2019
Article image
الأمين العام للأمم المتحدة، بان كي مون.
مصدر الصورة: EMILIO MORENATTI/AP
استمع أولاً إلى هذا المقطع الصوتي باللغة الإسبانية: وفيما يلي الترجمة الإنجليزية الصوتية عندما نُدرج المقطع الإسباني الآنف في نظام ترجمة آلية تقليدي: والآن إليك كيف يبدو المقطع عندما نُدرجه في نظام الترجمة الآلية الجديد الذي طورته شركة جوجل: صحيح أن النتيجة ليست مثالية، لكنك بلا شك تستطيع إدراك كيف تمكَّن "مُترجم جوجل" من الإبقاء على النبرة والطابع الصوتي للمُتحدث الأصلي. وقد تمكّن "نظام ترجمة جوجل" من القيام بذلك لأنه يحوّل المقطع الصوتي المُدخَل مباشرةً إلى مقطع صوتيّ كنتيجة دون أي خطوات بَيْنِية، وهذا ما لا تقوم به نُظُم الترجمة التقليدية، بل إنها تحوّل الصوت إلى نصّ أولاً، ثم تترجم النص، ومن ثم تؤلّف المقطع الصوتي من الصفر، مما يؤدي إلى الفقدان الكلي لمميزات الصوت الأصلي. ويتكوّن نظام الترجمة الجديد -المُسمى "ترانسلاتوترون" (Translatotron)- من ثلاثة عناصر، تقوم جميعها بتفحّص المخطط الطيفي لصوت المتحدث الأصلي، حيث يتمثل المخطط الطيفي في صورة للتردّدات التي تظهر أثناء تشغيل الصوت، وغالباً ما تُدعى: "بصمة صوتية" (voiceprint). ويستخدم العنصر الأول شبكةً عصبونية مُدرّبة على التقاط المخطط الطيفي للمقطع الصوتي باللغة المصدر (المُدخَل) ورسم المخطط الطيفي للمقطع الصوتي للغة الهدف (المُخرَج). وبعد ذلك يقوم العنصر

مقالك الأول مجاناً، أدخل بريدك الإلكتروني واقرأ.

أو اشترك الآن واستفد من العرض الأقوى بمناسبة اليوم الوطني السعودي.
25% على الاشتراكات السنوية في مجرة.



مراسلة الذكاء الاصطناعي ، إم آي تي تكنولوجي ريفيو