هو تقنية صوتية تسمى أيضاً "استنساخ الصوت" الغرض منها محاكاة صوت شخص حقيقي. على الرغم من أن الصوت اصطناعي إلا أنه من الممكن أن يطابق أصوات الإنسان ويمكنه تكرار النغمة واللهجات والإيقاع وغيرها من الخصائص الفريدة بدقة.
ظهرت تقنية التزييف العميق لأول مرة في نوفمبر/ تشرين الثاني 2017 عندما نشر مستخدم مجهول على منصة التواصل الاجتماعي ريديت (Reddit) خوارزمية استفادت من خوارزميات الذكاء الاصطناعي الحالية لإنشاء مقاطع فيديو مزيفة.
تتم عملية الكلام عندما يتدفق الهواء من الرئتين أعلى القصبة الهوائية عبر الحنجرة. يؤدي ذلك إلى اهتزاز الحبال الصوتية ما ينتج الصوت المسموع.
بالنسبة لعملية إنتاج الأصوات المزيفة، يتم إنتاجها من خلال تدريب الشبكة العصبونية لاستخراج الخصائص الصوتية من تسجيلات صوت الشخص المستهدف.
قد تحتاج الشبكة العصبونية إلى ما يقل عن 20 ثانية حتى تستطيع إنتاج صوت مشابه لصوت الشخص المحدد.
على الرغم من الجانب السلبي الكبير لتقنية التزييف العميق للصوت فإن لديه جانباً مشرقاً، مثل أي تقنية ذات حدين، وتتجلى أهم المزايا بـ:
توجد العديد من المجالات التي لا تعد ولا تحصى تستفيد من تقنيات التزييف العميق للصوت ومنها: