ابزار داده کاوی R

معرفی زبان برنامه نویسی R :

یکی از زبان های برنامه نویسی و ابزار های پر کاربرد برای داده کاوی که به منظور انجام محاسبات آماری و تحلیلی بر روی داده ها وجود دارد زبان R می باشد که به صورت متن باز و رایگان است. البته این نرم افزار دو نسخه دیگر هم دارد که متن باز نیستند یکی برای پردازش داده های کلان (Big Data) و دیگری برای محاسبات ابری نیز دارد.

کاربرد های نرم افزار R :

نرم افزار R در رشته های علوم پایه و رشته های مختلف پزشکی، فنی و غیره که به نوعی با محاسبات آماری سر و کار دارند، کاربرد دارد. برخی از رشته هایی که نرم افزار R بیشتر در آن ها استفاده می شوند عبارت اند از: رشته بیوانفورماتیک یا زیست داده ورزی که دانش استفاده از آمار و احتمالات و علوم کامپیوتر در زمینه زیست شناسی مولکولی یا بیولوژی می باشد.

تاریچخه زبان نرم افزار R :

پروژه زبان برنامه نویسی R در سال ۱۹۹۵ توسط Robert Gentleman و Ross Ihaka در گروه آمار دانشگاه Auckland نیوزلند بوجود آمد. این زبان برنامه نویسی به صورت متن باز و رایگان و تحت لایسنس GPL عرضه شده است. در حال حاضر این زبان به دلیل وجود قابلیت ها و امکانات فراوان از سوی مشتریان مختلف مورد استفاده قرار می گیرد.

امکاناتی که نرم افزار R برای کاربران خود فراهم می کند به شرح زیر است.

  • زبان برنامه نویسی ساده و پیشرفته شامل عبارت های شرطی ،حلقه و توابع بازگشتی و ….
  • امکانات دخیره ،بازیابی و دستکاری داده ها
  • بسته های نرم افزاری قدرتمند برای تجزیه و تحلیل آماری
  • کتابخانه های انجام عملیات داده کاوی و یادگیری ماشین مانند دسته بندی ، خوشه بندی ،تحلیل شبکه اجتماعی، یادگیری تقویتی و ..
  • امکانات گرافیکی برای تجزیه و تحلیل داده ها و رسم نمودار
  • کتابخانه های خاص برای انجام عملیات تحلیلی در زمینه های مختلف علمی
  • دارای مستندات فرمت بندی شده و منظم برای استفاده از زبان و کتابخانه های مرتبط

دلیل محبوبیت و مزایای نرم‌افزار R

دلیل محبوبیت این نرم‌افزار در بین کاربران، در درجه  اول رایگان بودن این نرم‌افزار است. از طرفی دیگر این نرم‌افزار بر روی انواع سیستم عامل‌ها قابل نصب بوده و مشکل بسیاری از کاربران را ساده نموده. از دیگر مزایای این نرم‌افزار فراهم کردن زمینه‌ای بی‌نظیر برای نوشتن متدهای آماری و قابلیت توسعه همچون دیگر نرم‌افزارهای باز است. نرم‌افزار R علاوه بر نسخه متن‌باز، نسخه‌های غیر متن‌باز نیز دارد و یکی دیگر از مزایای زبان R حجم بالای داکیومنت و مستندات آن است.

محدودیت‌ها و معایب  زبان برنامه نویسی R

  • برای استفاده و برنامه‌نویسی با آن باید فرمان‌ها آن را بیاموزید.
  • زبانRدارای مفسر است ، بدین معنی که برای اجرا، ترجمه نمی‌شود و به‌صورت فایل اجرایی (.exe*) درنمی‌آید.
  • دارای امکان ایجاد Gui نیست.
  • عدم پشتیبانی یک سیستم تجاری قوی از برنامه R
  • تکنیک‌های تحلیلی به شرایط و حجم داده‌ها جهت پردازش محدود است که نباید از مقدار ۱۶ ترابایت تجاوز کند که این امر می‌تواند در برخی از کاربردها یک محدودیت جدی تلقی گردد که در آن شرایط استفاده از این ابزار چندان مناسب نخواهد بود.

نرم‌افزار R در چه رشته‌هایی کاربرد دارد؟

  • آمار و احتمالات
  • آمار زیستی
  • زیست‌شناسی و شاخه‌های مرتبط
  • علوم پزشکی و داروسازی
  • بیوتکنولوژی
  • اپیدمیولوژی و علوم محیطی
  • بیوانفورماتیک
  • علوم کامپیوتر
  • فیزیک
  • شیمی (کمومتریک)
  • آمار مکانیک
  • علوم روانشناسی و اجتماعی
  • مدیریت
1232 بازدید