هي طريقة من طرق التعلم الآلي الموجه، تستخدم لفرز البيانات إلى مجموعات متشابهة من حيث السمات المحددة مسبقاً. وتعمل خوارزمية التصنيف في التعلم الآلي على النمذجة التنبؤية مثل تصنيف البريد الإلكتروني المرغوب به والطقس وغيرها الكثير.
الهدف الرئيسي لخوارزمية التصنيف هو تحديد فئة مجموعة بيانات معينة، وتستخدم هذه الخوارزميات بشكل أساسي للتنبؤ بمخرجات البيانات المقسمة لفئات، ما يجعل الاستفادة من هذه البيانات أسهل.
توجد أربع أنواع أساسية للتصنيف في التعلم الآلي وهي:
الهدف منها هو تصنيف بيانات المدخلات إلى فئتين متعارضتين، وتوصف بيانات التدريب في مثل هذه الحالة في شكل ثنائي. مثلاً، صحيح وخاطئ، إيجابية وسلبية، و0 و1. على سبيل المثال، قد نرغب في اكتشاف ما إذا كانت صورة معينة عبارة عن شاحنة أو قارب.
يحتوي التصنيف متعدد الفئات على فئتين متعارضين على الأقل، حيث الهدف هو التنبؤ بالفئة التي ينتمي إليها مثال إدخال معين، مثل تصنيف الحروف المكتوبة بخط اليد من ألف إلى ياء أو تصنيف أنواع النباتات.
يقوم بالتنبؤ بأكثر من فئة لكل إدخال مثل تطبيقات الرؤية الحاسوبية التي تصنف أغراض متعددة داخل صورة واحدة مثل صورة تحتوي على شاحنة وقارب وكلب معاً.
يتم توزيع عدد الأمثلة بشكل غير متساوٍ في كل فئة، ما يعني أنه يمكننا الحصول على فئة واحدة أكبر من الأخرى في بيانات التدريب. مثلاً ليكن التصنيف التالي المكون من 3 فئات حيث تحتوي بيانات التدريب على: 60% من الشاحنات و25% من الطائرات و15% من القوارب.
توجد العديد من خوارزميات التصنيف والتي تقوم بوظائف مختلفة مثل:
في الحياة اليومية تستخدم خوارزميات التصنيف بكثرة في العديد من التطبيقات المهمة مثل: