بيانات التحقق VALIDATION DATA

1 دقيقة

ما هي بيانات التحقق؟

عبارة عن مجموعة بيانات تحتوي على عدد من الأمثلة المختلفة عن تلك الموجودة في مجموعة بيانات التدريب، وتستخدم أثناء عملية التدريب لضبط المعاملات الفائقة، وبالتالي إيجاد نموذج التعلم الآلي الأفضل لحل مشكلة معينة وأمثلته. تُعتبر بيانات التحقق الاختبار الأول للنموذج على بيانات لم يراها من قبل. الأمر الذي يسمح لعلماء البيانات بتقييم أداء ذلك النموذج والتنبؤات التي يقوم بها بالنسبة للبيانات الجديدة.

تُشكل بيانات التحقق عادةً حوالي 20% من إجمالي البيانات المستخدمة لتطوير نموذج تعلم آلي. وتُعد مرحلة التحقق مرحلة وسيطة تُساعد نتائجها على ضبط المعاملات الأساسية مثل معدل التعلم وعدد الطبقات الخفية وغيرها بهدف أمثلة النموذج. كما أن هذه المرحلة ضرورية لأن التعديلات التي تتم فيها تؤدي إلى تجنب مشكلة فرط الملائمة التي تؤثر بشكل كبير على دقة ذلك النموذج عند تغذيته ببيانات جديدة.