×
  • ابزار داده کاوی تاناگرا (Tanagra)

    Tanagra یک ابزار داده کاوی برای اهداف علمی و پژوهشی است. این ابزار شامل چندین تکنیک داده کاوی همچون تجزیه و تحلیل داده ها، ماشین لرنینگ، یادگیری آماری و غیره میباشد. این ابزار همچون یک پلتفورم تجربی رفتار میکند تا شما بتوانید متد خودتان را برای مقایسه عملکرد های مختلف به آن اضافه کنید.

    ابزار داده کاوی می نی تب (Minitab)

    مینی‌تب (Minitab) یک نرم‌افزار کنترل کیفیت آماری و مناسب برای پروژه‌های شش سیگما و بهبود کیفیت می‌باشد. این نرم‌افزار به عنوان یکی از نرم‌افزارهای تخصصی آمار برای کنترل کیفیت، کار بر روی اعداد و تجزیه و تحلیل داده‌های خام شناخته شده‌است و در بسیاری از واحدهای صنعتی بزرگ و کوچک مورد استفاده قرار می‌گیرد و به وسیله آن می‌توان با تجزیه و تحلیل داده‌های آماری به طراحی آزمایش پرداخت. همچنین انجام برخی عملیات‌ها مانند تولید اعداد تصادفی که از توزیع‌های آماری خاصی مانند توزیع نرمال، کی دو(خی دو)، گاما، اف، برنولی، پواسن، بتا، وایبل و … پیروی می‌کنند، پرداخت.

    ابزار داده کاوی اس پی اس اس مدلر (SPSS Modeller)

    نرم افزار IBM SPSS Modeler یک نرم افزار کاربردی برای داده کاوی و تجزیه و تحلیل متن است که توسط شرکت آی بی ام توسعه یافته است. این نرم افزار برای ایجاد مدل های پیش بینی کننده و انجام سایر امور تجزیه و تحلیل مورد استفاده قرار می‌گیرد.

    ابزار داده کاوی وکا (Weka)

    «وکا» (WEKA) را می‌توان یک ابزار پیشرفته «یادگیری ماشین» (Machine Learning) و «داده‌کاوی» (Data Mining) برشمرد. این نرم‌افزار رایگان تحت مجوز عمومی «گنو» (GNU- General Public License) قابل استفاده است. این نرم‌افزار شامل مجموعه‌ای از ابزار‌های «بصری سازی» (Visualization)، روش‌های تحلیل داده‌ها و مدل‌های پیش‌بینی است که در یک رابط گرافیکی گرد هم آمده‌اند تا کاربر بهترین شیوه اجرای دستورات را در اختیار داشته باشد.

    ابزار داده کاوی رپیدماینر (Rapidminer)

    RapidMiner نرم افزاری توانمند در مباحث داده کاوی، یادگیری ماشینی، تحلیل و پیش بینی و تحلیل کسب و کار میباشد. این برنامه کاربردهای زیادی هم در امور تجاری و کسب و کار و هم در امور تحقیقاتی، آموزشی، یادگیری و … دارد. محققین و افراد علاقه مند به مباحث داده کاوی و یادگیری ماشینی میتوانند با استفاده از این برنامه تمامی مراحل مورد نیاز را از آماده سازی اطلاعات اولیه گرفته تا بصری کردن نتایج، ارزیابی و اعتبار سنجی و بهینه سازی خروجی را در یک محیط یکپارچه و واحد انجام دهند. هسته اصلی این پلتفرم نرم افزاری به صورت متن باز و رایگان عرضه شده است که بر اساس آن محصولات رایگان و تجاری زیادی نوشته شده است.

    الگوریتم بهینه سازی ازدحام ذرات

    روش بهینه‌سازی ازدحام ذرات (Particle swarm optimization) یا به اختصار PSO، یک روش سراسری بهینه‌سازی است که با استفاده از آن می‌توان با مسائلی که جواب آن‌ها یک نقطه یا سطح در فضای n بعدی می‌باشد، برخورد نمود. در اینچنین فضایی، فرضیاتی مطرح می‌شود و یک سرعت ابتدایی به آن‌ها اختصاص داده می‌شود، همچنین کانال‌های ارتباطی بین ذرات در نظر گرفته می‌شود. سپس این ذرات در فضای پاسخ حرکت می‌کنند، و نتایج حاصله بر مبنای یک «ملاک شایستگی» پس از هر بازهٔ زمانی محاسبه می‌شود. با گذشت زمان، ذرات به سمت ذراتی که دارای ملاک شایستگی بالاتری هستند و در گروه ارتباطی یکسانی قرار دارند، شتاب می‌گیرند. علی‌رغم اینکه هر روش در محدوده‌ای از مسائل به خوبی کار می‌کند، این روش در حل مسائل بهینه‌سازی پیوسته موفقیت بسیاری از خود نشان داده‌است.

    یادگیری بدون نظارت

    یادگیری بدون نظارت یک روش یادگیری ماشین است که در آن کاربران نیازی به نظارت بر مدل ندارند. در عوض ، به مدل اجازه می دهد تا به تنهایی برای کشف الگوها و اطلاعاتی که قبلاً کشف نشده بودند کار کند، این کار عمدتا با داده های بدون برچسب سروکار دارد.

    الگوریتم Apriori

    الگوریتم اپریوری Apriori از اولین الگوریتم هایی است که جهت یافتن مجموعه اقلام تکرار شده از آن استفاده می شود. نام این الگوریتم برگرفته از شیو های است که از آن استفاده می کند، یعنی استفاده از دانش مرحله قبل که در ادامه آن را تشریح می کنیم. الگوریتم Apriori توسط اگراوال Agrawal و همکاران، در مرکز تحقیقات IBM Almaden کشف شد و می توان آن را برای تولید کلیه مجموعه اقلام تکرار شده بکار برد.

    الگوریتم خوشه بندی SOM

    يكي ديگر از اهداف داده‌کاوی پديده‌ی خوشه‌بندي مي‌باشد، كه به فرآيند تقسيم مجموعه‌اي از داده‌ها (يا اشياء) به زير كلاس‌هايي با مفهوم خوشه‌ اشاره دارد. يك خوشه‌، يك‌ سري داده‌هاي مشابه مي‌باشد كه همانند يك گروه واحد رفتار مي‌كنند. لازم به ذكر است، خوشه‌بندي تاحدودی مشابه کلاس‌بندی است، با اين تفاوت كه كلاس‌ها از پيش‌تعريف‌شده و معين نمي‌باشند و عمل گروه‌بندي داده‌ها بدون نظارت انجام مي‌گيرد .

    الگوریتم خوشه بندی مبتنی بر چگالی (غلظت)

    خوشه‌بندی ارجاع به کار شناسایی گروه‌ها یا خوشه‌ها در یک دیتاست داده می‌شود. در خوشه بندی مبتنی بر غلظت، یک خوشه‌، مجموعه‌ای از اشیای داده‌ای است که این اشیا در فضای داده در یک منطقه پیوسته‌ای با غلظت بالا از اشیا پخش شده‌اند. خوشه‌های مبتنی بر غلظت از یک دیگر به وسیله مناطق کم غلظت اشیا جدا هستند. اشیای داده در مناطق کم غلظت معمولا پر نویز یا پرت ملاحظه می‌شوند.

    الگوریتم خوشه بندی سلسه مراتبی

    یکی از روش‌های «یادگیری ماشین» (Machine Learning) که به «آموزش بدون نظارت» (Unsupervised Learning) شهرت دارد، تحلیل خوشه‌بندی (Clustering Analysis) است. در این روش، برعکس خوشه بندی k-میانگین، هر مشاهده ممکن است در بیش از یک خوشه قرار گیرد زیرا براساس سطوح مختلف فاصله، خوشه‌ها تشکیل می‌شود. بنابراین هر خوشه ممکن است زیر مجموعه خوشه دیگر در سطحی از فاصله قرار گیرد. به هر حال خوشه‌بندی روش است که به کمک «ویژگی‌ها» (Features) یا «صفت‌ها» (Attributes) مشاهدات، آن را به گروه‌های مشابه طبقه‌بندی می‌کند.

    زبان برنامه نویسی متلب

    متلب (MATLAB) یک زبان برنامه نویسی سطح بالای نسل چهارم و یک محیط تعاملی برای محاسبات عددی، تجسم و برنامه‌نویسی می‌باشد که از ترکیب دو واژه MATrix (ماتریس) و LABoratory (آزمایشگاه) ایجادشده است. این نام حاکی از رویکرد ماتریس محور برنامه است که در آن حتی اعداد منفرد نیز به صورت یک ماتریس با ابعاد ۱*۱ در نظر گرفته می‌شود.

    الگوریتم خوشه بندی K-Mediods

    الگوریتم k-Medoids که بهبود یافته الگوریتم k-Means است، عملکردی بسیار شبیه به الگوریتم k-Means دارد، با این تفاوت که در الگوریتم k-Medoids به جای استفاده از میانگین، از خود نمونه ها برای مرکز ثقل و نمایندگی خوشه ها استفاده می شود. با انتخاب نمونه های واقعی جهت نمایش یک خوشه، حساسیت روش نسبت به نمونه های نویز و خارج از محدوده کاهش می یابد. فراموش نکنید که الگوریتم k-Medoids به دلیل اینکه حتی تعداد کمی از این داده ها می تواند در مقدار میانگین تأثیر بگذارد، الگوریتم به اینگونه از داده ها بسیار حساس است.

    الگوریتم خوشه بندی DBScan

    DBSCAN یک روش خوشه‌بندی است که توسط مارتین اِستر، هانس-پتر کریگل، یورگ ساندر و شیائووی شو در ۱۹۹۶ میلادی (۱۳۷۵ شمسی) ارائه گردیده‌است. مزیت این روش به نسبت روش‌های دیگری خوشه‌بندی مانند خوشه‌بندی کی-میانگین این است که نسبت به شکل داده‌ها حساس نمی‌باشد و می‌تواند اشکال غیر منظم را نیز در داده‌ها تشخیص دهد.

    الگوریتم خوشه بندی K-Means

    خوشه‌بندی کی-میانگین (k-means clustering) روشی در کمی‌سازی بردارهاست که در اصل از پردازش سیگنال گرفته شده و برای آنالیز خوشه بندی در داده کاوی محبوب است. کی-میانگین خوشه‌بندی با هدف تجزیه n مشاهدات به k خوشه است که در آن هر یک از مشاهدات متعلق به خوشهای با نزدیکترین میانگین آن است، این میانگین به عنوان پیش‌نمونه استفاده می‌شود. این به پارتیشن‌بندی داده‌های به یک دیاگرام ورونوی تبدیل می‌شود.

    الگوریتم طبقه بندی بگینگ

    طبقه‌بندهای ترکیبی از ترکیبِ چندین طبقه‌بند (classifier) استفاده می‌کنند. در واقع این طبقه‌بندها، هر کدام مدلِ خود را بر روی داده‌ها ساخته و این مدل را ذخیره می‌کنند. در نهایت برای طبقه‌بندیِ نهایی یک رای‌گیری در بین این طبقه‌بند‌ها انجام می‌شود و آن طبقه‌ای که بیشترین میزانِ رای را بیاورد، طبقه‌ی نهایی محسوب می‌شود.

    الگوریتم طبقه بندی KNN

    الگوریتم KNN نوعی از الگوریتم های یادگیری ماشین تحت نظارت است که هم در مسائل طبقه بندی و هم در مسائل رگرسیون پیشگویانه مورد استفاده قرار می گیرد. اگرچه، غالبا در مسائل طبقه بندی پیشگویانه، در صنعت از آن استفاده می شود.

    0