دیتاست Gisette


در حال بارگذاری
۳۶,۹۰۰ تومان
خرید

دیتاست Gisette:

این پروژه مربوط به دیتاستGisette می باشد. رقم ها اندازه عادی شده اند و در یک تصویر ثابت اندازه ابعاد ۲۸ × ۲۸ قرار دارند. داده اصلی برای هدف چالش انتخاب ویژگی اصلاح شد. به طور خاص، پیکسل ها به صورت تصادفی در قسمت بالای وسط اطلاعات قرار گرفتند که حاوی اطلاعات لازم برای یکپارچه سازی ۴ از ۹ و ویژگی های مرتبه بالاتر به عنوان محصولات این پیکسل ها بود تا مشکل را در یک فضای ویژگی بعدی بالاتر ببرند. ما همچنین تعدادی از ویژگی های منحرف کننده به نام “پروب” که قدرت پیش بینی ندارند اضافه کردیم. منظور از ویژگی ها و الگوهای تصادفی بود.

این مجموعه داده یکی از پنج مجموعه داده مورد استفاده در چالش انتخاب NIPS 2003 است. وب سایت ما هنوز برای درخواست ارسال پس از باز شدن است. اطلاعات مربوط به سایر چالش های مرتبط با آن در زیر آمده است: بسته CLOP شامل کد نمونه برای پردازش این داده ها است.

تمام جزئیات در مورد آماده سازی داده ها در گزارش فنی ما یافت می شود: طراحی آزمایش برای معیار ارزیابی متغیر NIPS 2003، ایزابل گوئون، ژوئیه ۲۰۰۳، (همچنین در آرشیو داده ها موجود است). چنین اطلاعاتی تنها پس از پایان چالش موجود بود. داده ها به آموزش، اعتبارسنجی و مجموعه تست تقسیم می شوند. مقادیر هدف تنها برای ۲ مجموعه اول ارائه شده است.

داده ها در فرمت زیر هستند:

نام داده پارامتر:  پارامترها و آمار مربوط به داده ها

نام نام خانوادگی شاهکار : هویت ویژگی ها (برای جلوگیری از انتخاب ویژگی های تغییر پذیری).

داده ها نام داده اطلاعات قطار: مجموعه آموزش (یک ماتریس منظم، الگوهای خطوط، ویژگی ها در ستون ها).

داده های نام داده معتبر: تنظیم اعتبار. اطلاعات داده نام آزمون : مجموعه تستنام داده های قطار برچسب  : برچسب ها (ارزش حقیقی کلاس ها) برای نمونه های آموزشی.نام داده معتبر است : اعتبار سنجی مجموعه برچسب (در زمان معامله، اما ارائه شده در حال حاضر).
نام برچسب آزمایش داده ها:  برچسب های مجموعه تست (حذف شده، بنابراین داده ها هنوز هم می تواند به عنوان یک معیار استفاده شود).

تعداد نمونه ها:

۱۳۵۰۰ نمونه

تعداد ویژگی ها:

۵۰۰۰ ویژگی

داده های پرت:

این دیتاست فاقد داده های پرت یا Missing Values می باشد.

امکانات پروژه دیتاست Gisette:

  • این دیتاست دارای یک داکیومنت کامل فارسی است. در این داکیومنت عنوان دیتاست، توضیحات کامل دیتاست، تعداد ویژگی ها، تعداد نمونه ها، توضیح تمام ویژگی های موجود و لینک دیتاست تشریح شده است.
  • این دیتاست دارای یک داکیومنت کامل انگلیسی نیز می باشد، که در این دیتاست اطلاعات کاملی به زبان لاتین در رابطه با دیتاست معرفی شده ارائه شده است.
  • پس از خرید، امکان دانلود فایل اصلی دیتاست در قالب فایل اکسل میسر است.
  • فایل پیش پردازش دیتاست
  • وجود فایل ARFF و قابل اجرا در نرم افزار داده کاوی مثل وکا
  • امکان دانلود لینک دیتاست در یک فایل متنی به صورت جداگانه

 

نکته: برای این دیتاست انواع الگوریتم های داده کاوی اهم از ۱۴۷ الگوریتم دسته بندی (مثل: درخت تصمیم، شبکه عصبی، ماشین بردار پشتیبان و …)، ۶ الگوریتم خوشه بندی (مثل: K-Means ، DBSCAN ،X-Means و…)، ۳ الگوریتم انجمنی (مثل Apriori ، FP-Growth  و …) و چندین الگوریتم انتخاب ویژگی (مثل PSO و …) با استفاده از ابزارهای داده کاوی و برنامه نویسی اهم از رپیدماینر، وکا، تاناگرا، SPSS، مدلر، کلمنتاین، متلب و … تهیه و پیاده سازی شده است.

  راهنمای خرید:
  • لینک دانلود فایل بلافاصله پس از پرداخت وجه نمایش داده می شود.
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید کافیست به ایمیل سایت درخواستتان را ارسال نمایید.
  • حدود 90% از پروژه ها دارای داکیومنت و فیلم آموزشی می باشند.