برنامج تحويل الكلام إلى نص هو نوع من البرامج التي تأخذ المحتوى الصوتي وتنقله إلى كلمات مكتوبة في معالج الكلمات. يعد هذا النوع من برامج التعرف إلى الكلام ذا قيمة كبيرة لأي شخص يحتاج إلى إنشاء الكثير من المحتوى المكتوب دون الكثير من الكتابة اليدوية. كما أنه مفيد للأشخاص ذوي الإعاقة الذين يصعب عليهم استخدام لوحة المفاتيح.
تستخدم أنظمة التعرف إلى الكلام خوارزميات الحاسوب لمعالجة الكلمات المنطوقة وتفسيرها وتحويلها إلى نص. ثم يقوم البرنامج بتحويل الصوت الذي يسجله الميكروفون إلى لغة مكتوبة يمكن للحواسيب والبشر فهمها، باتباع الخطوات الأربع التالية:
يجب أن يتكيف برنامج التعرف إلى الكلام مع الطبيعة شديدة التغير والخاصة بالسياق للكلام البشري. يتم تدريب خوارزميات البرامج التي تعالج وتنظم الصوت في نصوص على أنماط الكلام المختلفة وأنماط التحدث واللغات واللهجات والصياغات. يفصل البرنامج أيضاً الصوت المنطوق عن ضوضاء الخلفية التي غالباً ما تصاحب الإشارة.
لتلبية هذه المتطلبات، تستخدم أنظمة التعرف إلى الكلام نوعين من النماذج: