دیتاست (کوچک) Soybean
این پروژه مربوط به دیتاست (کوچک) Soybean می باشد .
زیر مجموعه ای از پایگاه داده اصلی است. برای اطلاعات بیشتر مراجعه کنید به Fisher و Schlimmer در نامهای soybean-large.names.
استیون سدرس نوشت:
> شکل ۱۵ در مقاله Michalski و استپ (PAMI-82) می گوید که
> مقادیر تبعیضی برای ویژگی ویژگی های PODU FRUIT برای
> کلاس ها Rhizoctonia Root Rot و Phytophthora Rot “چند یا هیچکدام”
> و “غیر مرتبط” به ترتیب. با این حال، در مجموعه داده های SOYBEAN-SMALL
> من از UCI دریافت کردم، ارزش برای این ویژگی “dna” (اعمال نمی شود)
> برای هر دو کلاس داده های واقعی را برای موارد D3 نشان می دهد
> (Root Rhizoctonia Rot) و D4 (Phytophthora Rot). بر اساس
> نامهای صحیح داده شده در نامهای soybean-large.name، FRUIT-PODS صفت است
> # 28. اگر شما در ستون ۲۸ در داده های زیر (با علامت با فلش مشخص شده) نگاه کنید
> متوجه خواهید شد که تمام موارد D3 و D4 دارای همان مقدار هستند. بدین ترتیب،
> مجموعه داده SOYBEAN-SMALL از UCI نمیتواند نتایج را تولید کند
> در مقاله Michalski و استپ
من این مقاله را ندارم، اما پیدا کردم که احتمالا تغییرات بعد از این رقم در مقاله استپپ است، که لیست ارزش “طبیعی” برای دو کلاس اول و “غیر مرتبط” برای دو کلاس دوم است. من اعتقاد دارم که “بی ربط” در اینجا به عنوان مترادف برای “غیر قابل اعمال”، “DNA” و “استفاده نمی شود” استفاده می شود. من اعتقاد دارم که در شکل خود در مقاله PAMI-83 خود، یک چاپ نادرست وجود دارد.
من بیش از هر مقدار ویژگی در این پایگاه داده را بررسی کرده ام. این دقیقا با نسخه هایی که در هر دو مقاله استپه و فیشر ذکر شده است مطابقت دارد.
تعداد نمونه ها:
۴۷
تعداد ویژگی ها:
۳۵
داده های پرت:
این دیتاست فاقد داده های پرت یا Missing Values می باشد
امکانات پروژه دیتاست (کوچک) Soybean:
- این دیتاست دارای یک داکیومنت کامل فارسی است. در این داکیومنت عنوان دیتاست، توضیحات کامل دیتاست، تعداد ویژگی ها، تعداد نمونه ها، توضیح تمام ویژگی های موجود و لینک دیتاست تشریح شده است.
- این دیتاست دارای یک داکیومنت کامل انگلیسی نیز می باشد، که در این دیتاست اطلاعات کاملی به زبان لاتین در رابطه با دیتاست معرفی شده ارائه شده است.
- پس از خرید، امکان دانلود فایل اصلی دیتاست در قالب فایل اکسل میسر است.
- فایل پیش پردازش دیتاست
- وجود فایل ARFF و قابل اجرا در نرم افزار داده کاوی مثل وکا
- امکان دانلود لینک دیتاست در یک فایل متنی به صورت جداگانه
نکته: برای این دیتاست انواع الگوریتم های داده کاوی اعم از ۱۴۷ الگوریتم دسته بندی (مثل: درخت تصمیم، شبکه عصبی، ماشین بردار پشتیبان و …)، ۶ الگوریتم خوشه بندی (مثل: K-Means ، DBSCAN ،X-Means و…)، ۳ الگوریتم انجمنی (مثل Apriori ، FP-Growth و …) و چندین الگوریتم انتخاب ویژگی (مثل PSO و …) با استفاده از ابزارهای داده کاوی و برنامه نویسی اعم از رپیدماینر، وکا، تاناگرا، SPSS، مدلر، کلمنتاین، متلب و … تهیه و پیاده سازی شده است.
- لینک دانلود فایل بلافاصله پس از پرداخت وجه نمایش داده می شود.
- همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
- ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
- در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید کافیست به ایمیل سایت درخواستتان را ارسال نمایید.
- حدود 90% از پروژه ها دارای داکیومنت و فیلم آموزشی می باشند.