التزييف العميق للصوت Voice Deepfake

1 دقيقة

ما هو التزييف العميق للصوت؟

هو تقنية صوتية تسمى أيضاً “استنساخ الصوت” الغرض منها محاكاة صوت شخص حقيقي. على الرغم من أن الصوت اصطناعي إلا أنه من الممكن أن يطابق أصوات الإنسان ويمكنه تكرار النغمة واللهجات والإيقاع وغيرها من الخصائص الفريدة بدقة.

تاريخ ونشأة التزييف العميق للصوت

ظهرت تقنية التزييف العميق لأول مرة في نوفمبر/ تشرين الثاني 2017 عندما نشر مستخدم مجهول على منصة التواصل الاجتماعي ريديت (Reddit) خوارزمية استفادت من خوارزميات الذكاء الاصطناعي الحالية لإنشاء مقاطع فيديو مزيفة.

إنتاج الأصوات الطبيعية والأصوات المزيفة

تتم عملية الكلام عندما يتدفق الهواء من الرئتين أعلى القصبة الهوائية عبر الحنجرة. يؤدي ذلك إلى اهتزاز الحبال الصوتية ما ينتج الصوت المسموع. 

بالنسبة لعملية إنتاج الأصوات المزيفة، يتم إنتاجها من خلال تدريب الشبكة العصبونية لاستخراج الخصائص الصوتية من تسجيلات صوت الشخص المستهدف.

قد تحتاج الشبكة العصبونية إلى ما يقل عن 20 ثانية حتى تستطيع إنتاج صوت مشابه لصوت الشخص المحدد.

مزايا التزييف العميق للصوت

على الرغم من الجانب السلبي الكبير لتقنية التزييف العميق للصوت فإن لديه جانباً مشرقاً، مثل أي تقنية ذات حدين، وتتجلى أهم المزايا بـ:

  • طريقة رائعة لإنشاء محتوى صوتي وديناميكي وفريد من نوعه.
  • توفير الوقت والمال من خلال السماح للشخص بإنشاء محتوى جديد بسرعة.
  • زيادة فرص الشركات بالإعلان والرعاية للشخصيات الصوتية والمشاهير والمؤثرين.
  • إعداد المحتوى المتكرر مثل نشرات الطقس وأخبار الرياضة.

أهم تطبيقات التزييف العميق للصوت

توجد العديد من المجالات التي لا تعد ولا تحصى تستفيد من تقنيات التزييف العميق للصوت ومنها:

  • الكتب الصوتية.
  • إنشاء مقاطع الفيديو التعليمية.
  • الحملات الإعلانية على مواقع التواصل الاجتماعي.
  • المساعدون الرقميون وبوتات الدردشة.
  • التطبيقات الخاصة بكبار السن وذوي الاحتياجات الخاصة.