هو عملية الفرز من خلال مجموعات البيانات الكبيرة لتحديد الأنماط والعلاقات التي يمكن أن تساعد في حل مشكلات العمل. حيث تمكن تقنيات وأدوات استخراج البيانات المؤسسات من التنبؤ بالاتجاهات المستقبلية واتخاذ قرارات عمل أكثر نجاحاً.
يعد التنقيب عن البيانات عنصراً أساسياً في التحليلات الناجحة في المؤسسات. حيث يمكن استخدام المعلومات التي نحصل عليها في ذكاء الأعمال وتطبيقات التحليلات التي تتضمن تحليل البيانات التاريخية، وتطبيقات التحليلات في الوقت الفعلي.
تنقسم عملية التنقيب عن البيانات إلى خمس خطوات:
يتضمن التنقيب عن البيانات استكشاف وتحليل كتل كبيرة من المعلومات لاستخلاص أنماط معينة، ويمكن استخدامها بعدة طرق، مثل تسويق قاعدة البيانات، وإدارة مخاطر الائتمان، واكتشاف الاحتيال، وتصفية البريد الإلكتروني العشوائي، أو حتى لتمييز مشاعر أو آراء المستخدمين.