الحقائق المرجعية GROUND-TRUTH

1 دقيقة

ما هي الحقائق المرجعية؟

مصطلح يستخدم في مجال الذكاء الاصطناعي للإشارة إلى الطبيعة الفعلية للمشكلة الهدف لنموذج التعلم الآلي، مُعبراً عنها باستخدام مجموعات البيانات ذات الصلة بتلك المشكلة، وبكلمات أخرى هي النتيجة المثالية المتوقعة لذلك النموذج. فعلى سبيل المثال تُعتبر البيانات الموسومة حقائق مرجعية في التعلم الموجّه لأنها ستُستخدم لتدريب النموذج على تحديد الأنماط وتوقع الوسوم المختلفة للبيانات الجديدة. يعود أصل استخدام مصطلح الحقائق المرجعية إلى علم الجيولوجيا والأرصاد الجوية. ويصف عملية التحقق من صحة البيانات وتفحصها على أرض الواقع.

ما أهمية الحقائق المرجعية؟

يمكن توضيح أهمية الحقائق المرجعية وأثرها على أداء نماذج التعلم الآلي من خلال طرح مثال عملي عن الأمر. فإذا افترضنا أن باحث ما يقوم بتطوير نظام تعلم آلي لتصنيف صور الآفات الجلدية إلى سرطانية أو لا. يمكن في هذه الحال وسم بيانات التدريب بطريقتين مختلفتين هما:

  1. الاستعانة بطبيب جيد لوسم كل صورة بناءً على تشخيصه.
  2. انتظار تحليل الخزعة المأخوذة من المريض، ووسم الصور على أساسه نظراً لكونه يعطي إجابة صحيحة تماماً، وفي هذه الحال تعتبر البيانات حقائق مرجعية.

عند استخدام البيانات التي تم جمعها بالطريقة الثانية (الحقائق المرجعية) في عملية التدريب من المحتمل أن يتفوق النموذج على الأطباء أنفسهم في تشخيص الحالة. أما في حال استخدام بيانات الطريقة الأول فإن النموذج سيتعلم محاكاة الأطباء فقط في أفضل الأحوال.