×
  • الگوریتم خوشه بندی SOM

    يكي ديگر از اهداف داده‌کاوی پديده‌ی خوشه‌بندي مي‌باشد، كه به فرآيند تقسيم مجموعه‌اي از داده‌ها (يا اشياء) به زير كلاس‌هايي با مفهوم خوشه‌ اشاره دارد. يك خوشه‌، يك‌ سري داده‌هاي مشابه مي‌باشد كه همانند يك گروه واحد رفتار مي‌كنند. لازم به ذكر است، خوشه‌بندي تاحدودی مشابه کلاس‌بندی است، با اين تفاوت كه كلاس‌ها از پيش‌تعريف‌شده و معين نمي‌باشند و عمل گروه‌بندي داده‌ها بدون نظارت انجام مي‌گيرد .

    الگوریتم خوشه بندی Optic

    الگوریتم خوشه بندی مبتنی بر چگالی (غلظت)

    خوشه‌بندی ارجاع به کار شناسایی گروه‌ها یا خوشه‌ها در یک دیتاست داده می‌شود. در خوشه بندی مبتنی بر غلظت، یک خوشه‌، مجموعه‌ای از اشیای داده‌ای است که این اشیا در فضای داده در یک منطقه پیوسته‌ای با غلظت بالا از اشیا پخش شده‌اند. خوشه‌های مبتنی بر غلظت از یک دیگر به وسیله مناطق کم غلظت اشیا جدا هستند. اشیای داده در مناطق کم غلظت معمولا پر نویز یا پرت ملاحظه می‌شوند.

    الگوریتم خوشه بندی سلسه مراتبی

    یکی از روش‌های «یادگیری ماشین» (Machine Learning) که به «آموزش بدون نظارت» (Unsupervised Learning) شهرت دارد، تحلیل خوشه‌بندی (Clustering Analysis) است. در این روش، برعکس خوشه بندی k-میانگین، هر مشاهده ممکن است در بیش از یک خوشه قرار گیرد زیرا براساس سطوح مختلف فاصله، خوشه‌ها تشکیل می‌شود. بنابراین هر خوشه ممکن است زیر مجموعه خوشه دیگر در سطحی از فاصله قرار گیرد. به هر حال خوشه‌بندی روش است که به کمک «ویژگی‌ها» (Features) یا «صفت‌ها» (Attributes) مشاهدات، آن را به گروه‌های مشابه طبقه‌بندی می‌کند.

    الگوریتم خوشه بندی X-Means

    الگوریتم خوشه بندی K-Mediods

    الگوریتم k-Medoids که بهبود یافته الگوریتم k-Means است، عملکردی بسیار شبیه به الگوریتم k-Means دارد، با این تفاوت که در الگوریتم k-Medoids به جای استفاده از میانگین، از خود نمونه ها برای مرکز ثقل و نمایندگی خوشه ها استفاده می شود. با انتخاب نمونه های واقعی جهت نمایش یک خوشه، حساسیت روش نسبت به نمونه های نویز و خارج از محدوده کاهش می یابد. فراموش نکنید که الگوریتم k-Medoids به دلیل اینکه حتی تعداد کمی از این داده ها می تواند در مقدار میانگین تأثیر بگذارد، الگوریتم به اینگونه از داده ها بسیار حساس است.

    الگوریتم خوشه بندی DBScan

    DBSCAN یک روش خوشه‌بندی است که توسط مارتین اِستر، هانس-پتر کریگل، یورگ ساندر و شیائووی شو در ۱۹۹۶ میلادی (۱۳۷۵ شمسی) ارائه گردیده‌است. مزیت این روش به نسبت روش‌های دیگری خوشه‌بندی مانند خوشه‌بندی کی-میانگین این است که نسبت به شکل داده‌ها حساس نمی‌باشد و می‌تواند اشکال غیر منظم را نیز در داده‌ها تشخیص دهد.

    الگوریتم خوشه بندی K-Means

    خوشه‌بندی کی-میانگین (k-means clustering) روشی در کمی‌سازی بردارهاست که در اصل از پردازش سیگنال گرفته شده و برای آنالیز خوشه بندی در داده کاوی محبوب است. کی-میانگین خوشه‌بندی با هدف تجزیه n مشاهدات به k خوشه است که در آن هر یک از مشاهدات متعلق به خوشهای با نزدیکترین میانگین آن است، این میانگین به عنوان پیش‌نمونه استفاده می‌شود. این به پارتیشن‌بندی داده‌های به یک دیاگرام ورونوی تبدیل می‌شود.

    0