یادگیری ماشین (بخش دوم)

در یادگیری نظارت شده به ازای هر ورودی، پاسخ درست را به سیستم مشخص می کنیم

مثلا در قیمت گذاری خانه، ما یک سری اطلاعات خانه ها را جمع آوری کردیم و به ازای هر کدام از آنها قیمت را نیز مشخص کردیم

x : اندازه خانه

y : قیمت خانه

اگر ما تابعی را بدست بیاریم که از نزدیکی داده ها عبور کند، می تونیم داده های قبلی را کنار بذاریم و توسط اون تابع، خروجی را برای یک ورودی جدید پیش بینی کنیم

پس یک فاز training هست که از روی داده ها یک تابع (فرضیه) را بدست میاریم و در فاز بعدی از طریق تابعی که بدست آوردیم، خروجی را برای داده جدید predict کنیم


آشنایی با برخی نمادها:

مجموعه آموزشی را به یک الگوریتم یادگیری میدیم و این الگوریتم یک تابع (فرضیه) را به عنوان خروجی به ما برمیگردونه

حالا هر x جدید را به عنوان ورودی به تابع بدست آمده میدیم و خروجی آن پیش بینی مورد نظرمان است یعنی y

ما با تغییر دادن پارامتر ها (تتا ها) می تونیم هر خطی را ایجاد کنیم

اگر x مجموعه از چندین ویژگی باشه مثل اندازه خانه، سال ساخت خانه و... در آن صورت تابع رگرسیون خطی چند متغیره خواهد بود

ما می خواهیم خطی را پیدا کنیم که تا حد ممکن به داده ها نزدیک باشه


تابع هزینه:

انتخاب پارامترها به گونه ای که به ازای هر نمونه آموزشی مانند (x, y) ، مقدار تابع هزینه تا حد ممکن به مقدار y نزدیک باشه

یعنی تابعی که میزان بد بودن یک فرضیه را بصورت یک عدد نشان دهد که می تونیم از تابع هزینه مجموع مربعات خطا استفاده کنیم.

منبع