×

الگوریتم خوشه بندی مبتنی بر چگالی (غلظت)

خوشه‌بندی ارجاع به کار شناسایی گروه‌ها یا خوشه‌ها در یک دیتاست داده می‌شود. در خوشه بندی مبتنی بر غلظت، یک خوشه‌، مجموعه‌ای از اشیای داده‌ای است که این اشیا در فضای داده در یک منطقه پیوسته‌ای با غلظت بالا از اشیا پخش شده‌اند. خوشه‌های مبتنی بر غلظت از یک دیگر به وسیله مناطق کم غلظت اشیا جدا هستند. اشیای داده در مناطق کم غلظت معمولا پر نویز یا پرت ملاحظه می‌شوند.

الگوریتم خوشه بندی DBScan

DBSCAN یک روش خوشه‌بندی است که توسط مارتین اِستر، هانس-پتر کریگل، یورگ ساندر و شیائووی شو در ۱۹۹۶ میلادی (۱۳۷۵ شمسی) ارائه گردیده‌است. مزیت این روش به نسبت روش‌های دیگری خوشه‌بندی مانند خوشه‌بندی کی-میانگین این است که نسبت به شکل داده‌ها حساس نمی‌باشد و می‌تواند اشکال غیر منظم را نیز در داده‌ها تشخیص دهد.

الگوریتم خوشه بندی K-Means

خوشه‌بندی کی-میانگین (k-means clustering) روشی در کمی‌سازی بردارهاست که در اصل از پردازش سیگنال گرفته شده و برای آنالیز خوشه بندی در داده کاوی محبوب است. کی-میانگین خوشه‌بندی با هدف تجزیه n مشاهدات به k خوشه است که در آن هر یک از مشاهدات متعلق به خوشهای با نزدیکترین میانگین آن است، این میانگین به عنوان پیش‌نمونه استفاده می‌شود. این به پارتیشن‌بندی داده‌های به یک دیاگرام ورونوی تبدیل می‌شود.

0