خوارزمية التصنيف Classification Algorithm

2 دقائق

ما هي خوارزمية التصنيف؟

هي طريقة من طرق التعلم الآلي الموجه، تستخدم لفرز البيانات إلى مجموعات متشابهة من حيث السمات المحددة مسبقاً. وتعمل خوارزمية التصنيف في التعلم الآلي على النمذجة التنبؤية مثل تصنيف البريد الإلكتروني المرغوب به والطقس وغيرها الكثير.

أهمية خوارزميات التصنيف

الهدف الرئيسي لخوارزمية التصنيف هو تحديد فئة مجموعة بيانات معينة، وتستخدم هذه الخوارزميات بشكل أساسي للتنبؤ بمخرجات البيانات المقسمة لفئات، ما يجعل الاستفادة من هذه البيانات أسهل.

أنواع خوارزميات التصنيف

توجد أربع أنواع أساسية للتصنيف في التعلم الآلي وهي:

التصنيف الثنائي

الهدف منها هو تصنيف بيانات المدخلات إلى فئتين متعارضتين، وتوصف بيانات التدريب في مثل هذه الحالة في شكل ثنائي. مثلاً، صحيح وخاطئ، إيجابية وسلبية، و0 و1. على سبيل المثال، قد نرغب في اكتشاف ما إذا كانت صورة معينة عبارة عن شاحنة أو قارب.

التصنيف متعدد الفئات

 يحتوي التصنيف متعدد الفئات على فئتين متعارضين على الأقل، حيث الهدف هو التنبؤ بالفئة التي ينتمي إليها مثال إدخال معين، مثل تصنيف الحروف المكتوبة بخط اليد من ألف إلى ياء أو تصنيف أنواع النباتات.

التصنيف متعدد المسميات

يقوم بالتنبؤ بأكثر من فئة لكل إدخال مثل تطبيقات الرؤية الحاسوبية التي تصنف أغراض متعددة داخل صورة واحدة مثل صورة تحتوي على شاحنة وقارب وكلب معاً. 

التصنيف غير المتوازن

يتم توزيع عدد الأمثلة بشكل غير متساوٍ في كل فئة، ما يعني أنه يمكننا الحصول على فئة واحدة أكبر من الأخرى في بيانات التدريب. مثلاً ليكن التصنيف التالي المكون من 3 فئات حيث تحتوي بيانات التدريب على: 60% من الشاحنات و25% من الطائرات و15% من القوارب.

أشهر خوارزميات التصنيف

توجد العديد من خوارزميات التصنيف والتي تقوم بوظائف مختلفة مثل:

تطبيقات خوارزمية التصنيف

في الحياة اليومية تستخدم خوارزميات التصنيف بكثرة في العديد من التطبيقات المهمة مثل:

  • التعرف على الكلام.
  • التعرف على الوجه.
  • التعرف على الحروف المكتوبة بخط اليد.
  • تصنيف الوثائق.
  • تصنيف الأمراض بناء على التشخيص أو الصور مثل سرطان الجلد.
  • مرشح البريد الإلكتروني غير المرغوب به.
  • تصنيف الصور الخاصة بالنباتات.
  • تصنيف صور الأقمار الصناعية لاستخدامها في الجيولوجيا.