الگوریتم طبقه بندی درخت تصمیم C5

درخت تصمیم (Decision Tree)

درخت تصمیم‌ گیری (Decision Tree) یک ابزار برای پشتیبانی از تصمیم می باشد که از درخت ‌ها جهت مدلسازی استفاده می ‌کند. در تحقیقات و عملیات های مختلف از درخت تصمیم به صورت معمول استفاده می گردد. به‌ طور خاص در آنالیز تصمیم، به منظور مشخص کردن استراتژی که با بیشترین احتمال به هدف برسد مورد استفاده قرار می گیرد. از دیگر کاربرد های درختان تصمیم، توصیف محاسبات احتمال شرطی می باشد.

الگوریتم درخت تصمیم C5

الگوریتم C5.0 یک نوع درخت تصمیم گیری تک متغیره و بهبود یافته الگوریتم C4.5 می باشد که توسط محقق استرالیایی کوئین لن در سال ۱۹۹۳ طراحی شده است. الگوریتم درخت تصمیم گیری C5 یا C5.0 Decision Tree Algorithm مثل الگوریتم طبقه بند درخت تصمیم CART در ابتدا درختی کامل پر ایجاد می کند اما استراتژی هرس آن متفاوت می باشد. این الگوریتم کلاسه بندی را با تقسیم داده ها به زیر مجموعه هایی که شامل رکورد های همگن تر از والد خود می باشند انجام می دهد. در الگوریتم درخت تصمیم C5 تقسیم کردن نمونه ها براساس فیلدی که بیشترین بهره اطلاعات را شامل شود، صورت می گیرد. هر زیر نمونه بوسیله اولین انشعاب تعیین می گردد. سپس براساس فیلد جدیدی دوباره تقسیم بندی انجام می شود و این فرایند به تکرار خواهد شد تا زمانی که زیر نمونه ها امکان تقسیم شدن را نداشته باشند. در نتیجه انشعاب ها به پایین ترین سطح از نوآزموده می رسند و آن انشعاب هایی که ارز چندانی ندارند از مدل حذف می گردد.

استنتاج قانون به کمک الگوریتم C5.0 براساس درخت تصمیم گیری (Decision Tree) می باشد. احتمالا بیشتر از یک قانون به ازای هر رکورد خاص صدق کند و یا هیچ قانونی مورد استفاده قرار نگیرد. در صورتی که چندین قانون برای یک رکورد مناسب باشند، آنگاه هر قانون مبتنی بر اطمینان مربوط به هر قانون، وزن vote می گیرد که در این صورت براساس ترکیب وزن تمام قوانین مناسب برای رکورد، پیش بینی نهایی تعیین می گردد و در صورتی که هیچ قانونی مناسبی در کار نباشند، یک پیش گویی پیش فرض به آن رکورد نسبت داده می شود.

1662 بازدید