الانحراف المعياري Standard Deviation

1 دقيقة

ما هو الانحراف المعياري؟

هو قيمة إحصائية تقيس مدى انتشار “تشتت” مجموعة البيانات بالنسبة لقيمة المتوسط، وتُحتسب عن طريق تحديد انحراف كل نقطة بيانات عن المتوسط في المجموعة المحددة.

أهمية الانحراف المعياري

يعد الانحراف المعياري بمثابة البوصلة الاحصائية لعالم البيانات، ويساعد على فهم القيم العددية بالإضافة لتمكين اتخاذ قرارات أكثر استنارة، بحيث يساعد على رؤية الأنماط والقيم المتطرفة. على سبيل المثال، تخيل أنك متنبئ بالطقس، إذا كنت تعلم أن الانحراف القياسي لدرجات الحرارة اليومية منخفض، فيمكن التنبؤ بأن معظم الأيام ستكون حول درجة الحرارة نفسها بسهولة، أما إذا كان الانحراف المعياري مرتفعاً فمن المتوقع وجود المزيد من الاختلافات في درجات الحرارة.

تطبيقات الانحراف المعياري في التعلم الآلي

يستخدم الانحراف المعياري لقياس مدى انتشار نقاط البيانات في مجموعة بيانات معينة، ما يفيد في مهام مختلفة مثل المعالجة المسبقة للبيانات وهندسة المزايا واختيار النماذج:

  • المعالجة المسبقة للبيانات: يستخدم الانحراف المعياري لتحديد وإزالة القيم المتطرفة، وهي نقاط من البيانات التي تقع خارج نطاق بيانات ميزة معينة ما يمكن أن يساعد على تحسين دقة النموذج عن طريق إزالة البيانات الضجيجية.
  • هندسة المزايا: يُستخدم لتوسيع نطاق المزايا ومواءمتها، ما يمكن أن يحسّن أداء النموذج من خلال جعل المزايا أكثر قابلية للمقارنة وأسهل في العمل معها.
  •  تقييم عدم اليقين: يمكن استخدام الانحراف المعياري لتحديد عدم اليقين المرتبط بتنبؤات نموذج التعلم الآلي، ويكون مفيداً بشكلٍ خاص في تطبيقات مثل التمويل بحيث تكون التنبؤات الدقيقة بعدم اليقين مهمة لصنع القرار.