خوارزميات التجميع Clustering Algorithms

1 دقيقة

ما هي خوارزميات التجميع؟

أسلوب تحليل البيانات الإحصائية المستخدمة في العديد من المجالات من خلال تجميعها في مجموعات تمتلك سمات متشابهة. 

تعد خوارزميات التجميع من الخوارزميات الأكثر شيوعاً في التعلم الآلي وتحديداً التعلم غير الموجه.

متى نستخدم خوارزميات التجميع؟

عندما تبدأ التفكير الناقد، أول ما عليك فعله هو التفكير في حالات استخدام أي تقنية ومتى علينا الابتعاد عنها. بالنسبة لخوارزميات التجميع هناك بعض الحالات الفعالة لاستخدام خوارزمية التجميع:

  • عندما تبدأ من مجموعة بيانات كبيرة غير منظمة وهي الحالة الأكثر فعالية للتجميع، حيث يتم تنظيم البيانات في مجموعات ما يجعلها أكثر قابلية للاستخدام.
  • عندما لا تعرف عدد الفئات التي تحتويها مجموعة البيانات الخاصة بك، وهنا يتم توضيح عدد الأصناف الموجودة في البيانات لتبني عليها القرار.
  • تعتبر بديلاً عن تقسيم البيانات يدوياً مثل خوارزميات التعرف على الكلام التي تنتج الملايين من الميزات التي لا يمكن تجميعها بشكل يدوي.
  • عند البحث عن الحالات الشاذة والقيم المتطرفة بسبب حساسيتها العالية يمكنها كشف الشذوذ مثل خوارزمية (DBSCAN).

أشهر أنواع خوارزميات التجميع

  • خوارزمية تجميع كي- المتوسط.
  • خوارزمية التجميع بالمتوسط المتحول (mean-shift).
  • خوارزمية التجميع دي بي سكان (DBSCAN).
  • خوارزمية التجميع نموذج غاوس المختلط.
  • خوارزمية التجميع الهرمية.

تطبيقات خوارزميات التجميع

تتعدد مجالات تطبيقات خوارزميات التجميع نظراً لتعدد استخداماتها وشمولها الكثير من الحالات، ومنها:

  • التسويق: يمكن استخدامها لتوصيف واكتشاف قطاعات العملاء لأغراض التسويق.
  • علم الأحياء: يمكن استخدامها للتصنيف بين أنواع مختلفة من النباتات والحيوانات.
  • المكتبات: تستخدم في تجميع الكتب المختلفة على أساس الموضوعات والمعلومات.
  • التأمين: تستخدم للتعرف على العملاء وسياساتهم وتحديد عمليات الاحتيال.
  • تخطيط المدن: تستخدم في تكوين مجموعات من المنازل ودراسة قيمها بناءً على مواقعها الجغرافية والعوامل الأخرى الموجودة.
  • دراسات الزلازل: من خلال معرفة المناطق المتضررة من الزلزال يمكننا تحديد المناطق الخطرة.