دیتاست TTC-3600: ارزیابی برای طبقه بندی متن ترکی


در حال بارگذاری
۵۵,۹۰۰ تومان
خرید

دیتاست TTC-3600: ارزیابی برای طبقه بندی متن ترکی

این پروژه مربوط به دیتاست TTC-3600: ارزیابی برای طبقه بندی متن ترکی می باشد .مجموعه داده شامل مجموع ۳۶۰۰ اسناد از جمله ۶۰۰ خبر / متن از شش مقوله “اقتصاد، فرهنگ، بهداشت، سیاست، ورزش و فن آوری “از شش پورتال و آژانس خبره مشهور (حریت، ایمیل، ایها، اخبار ترک ،رادیکال،زمان). اسناد مجموعه داده TTC-3600 از ماه مه تا ژوئیه ۲۰۱۵ با استفاده از فید Rich Site Summary (RSS))) از شش دسته از پورتال های مربوطه جمع آوری شد. تمام اسکریپت های جاوا، تگ های HTML (<img>، <a>، <p>، <strong> و غیره)، اپراتورها، علائم نقطه گذاری، شخصیت های غیر قابل چاپ و داده های نامناسب مانند تبلیغات حذف می شوند.نسخه TTS-3600 با استفاده از روشهای متفاوتی از روشهای مختلف تهیه شده است. در تمام نسخه های مجموعه داده ها، ابتدا، پیش پردازش مبتنی بر حذف، که در بخش ۳٫۲ به طور کامل توضیح داده شده، مورد استفاده قرار می گیرد. سپس لغات ترک ترکیه که دارای قدرت تبعیض آمیز نیستند (ضمایر، پیشنهادها، پیوندها و غیره) در رابطه با TC حذف می شوند از مجموعه داده ها به جز اصلی اصلی. در این مطالعه یک لیست متوقف کننده نیمه اتوماتیک ساخته شده با ۱۴۷ کلمه استفاده شده است.

تعداد نمونه ها:

۳۶۰۰

تعداد ویژگی ها:

۴۸۱۴

داده های پرت:

این دیتاست فاقد داده های پرت یا Missing Values می باشد

امکانات پروژه دیتاست TTC-3600: ارزیابی برای طبقه بندی متن ترکی :

  • این دیتاست دارای یک داکیومنت کامل فارسی است. در این داکیومنت عنوان دیتاست، توضیحات کامل دیتاست، تعداد ویژگی ها، تعداد نمونه ها، توضیح تمام ویژگی های موجود و لینک دیتاست تشریح شده است.
  • این دیتاست دارای یک داکیومنت کامل انگلیسی نیز می باشد، که در این دیتاست اطلاعات کاملی به زبان لاتین در رابطه با دیتاست معرفی شده ارائه شده است.
  • پس از خرید، امکان دانلود فایل اصلی دیتاست در قالب فایل اکسل میسر است.
  • فایل پیش پردازش دیتاست
  • وجود فایل ARFF و قابل اجرا در نرم افزار داده کاوی مثل وکا
  • امکان دانلود لینک دیتاست در یک فایل متنی به صورت جداگانه

 

نکته: برای این دیتاست انواع الگوریتم های داده کاوی اعم از ۱۴۷ الگوریتم دسته بندی (مثل: درخت تصمیم، شبکه عصبی، ماشین بردار پشتیبان و …)، ۶ الگوریتم خوشه بندی (مثل: K-Means ، DBSCAN ،X-Means و…)، ۳ الگوریتم انجمنی (مثل Apriori ، FP-Growth و …) و چندین الگوریتم انتخاب ویژگی (مثل PSO و …) با استفاده از ابزارهای داده کاوی و برنامه نویسی اعم از رپیدماینر، وکا، تاناگرا، SPSS، مدلر، کلمنتاین، متلب و … تهیه و پیاده سازی شده است.

  راهنمای خرید:
  • لینک دانلود فایل بلافاصله پس از پرداخت وجه نمایش داده می شود.
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید کافیست به ایمیل سایت درخواستتان را ارسال نمایید.
  • حدود 90% از پروژه ها دارای داکیومنت و فیلم آموزشی می باشند.