آشنایی با Adaboost

ایده Adaboost بر تقویت دسته بندهای (Classifiers) ضعیف استوار است. اجازه بدهید با یک مثال جلو برویم. فرض کنید مجموعه داده زیر را داریم:

در مجموعه داده بالا دو ویژگی داریم. برای سهولت در کار می توان مقادیر درست را برابر با 1 و مقادیر نادرست را برابر با 1 - در نظر گرفت. در ابتدای کار به همه مشاهدات وزن یکسانی تعلق خواهد گرفت. ستون (مقدار واقعی * وزن) از حاصل ضرب مقدار واقعی و وزن به دست می آید.

فرض کنید با استفاده از یک دسته بند (Classifier) مانند درخت تصمیم، ماشین بردارهای پشتیبان و... به پیش بینی مشاهدات بالا پرداخته شده است:

محاسبه دسته بند و مقایسه با مقادیر واقعی

از مقایسه ستون مقدار واقعی با ستون پیش بینی مشخص است که سه مورد از پیش بینی ها نادرست است. در ستون خطا این سه مورد با عدد 1 مشخص شده است. از همین رو متغیر epsilon = 0.3 درنظر می گیریم. (سه مورد از ده مورد پیش بینی اشتباه از آب درآمد!) حال متغیر جدیدی به نام alpha تعریف می کنیم:

alpha = ln[(1-epsilon)/epsilon] / 2 = ln[(1 – 0.3)/0.3] / 2

alpha = 0.42

از متغیر alpha برای به روز رسانی وزن ها در مرحله بعد استفاده می شود. وزن های جدید به صورت زیر محاسبه می شود:

وزن جدید = وزن قدیم * ( alpha -* مقدار واقعی*پیش بینی)exp

از همین رو داریم: