یادگیری تحت نظارت و بدون نظارت در یادگیری ماشین در سه دقیقه

توی این مطلب قصد دارم خیلی مختصر supervised learning و unsupervised learning که جزء سرفصل های یادگیری ماشین هستند رو توضیح بدم.


مقایسه‌ی یادگیری تحت نظارت و بدون نظارت
مقایسه‌ی یادگیری تحت نظارت و بدون نظارت


یکی از راه­ های ساده برای این که با یادگیری تحت نظارت آشنا بشیم اینه که دقیقاً به معنی این کلمه توجه کنیم. تحت نظارت به معنی "با دقت زیر نظر گرفتن" است. با دقت نظاره کردن اجرای یک پروژه، وظیفه یا یک فعالیت.

حالا این سوال به وجود میاد که چطور یک مدل یادگیری ماشین رو تحت نظر می‌گیریم؟ این کار رو با یاد دادن مدل انجام می ­دیم. به این صورت که مدل رو با دانش قبلی می‌­سازیم. بنابراین می­‌تونیم نمونه­ های آینده رو پیش­ بینی کنیم. اما سوال دیگه‌ای که ایجاد می­‌شه اینه که دقیقاً چطور این مدل رو آموزش می­ دیم؟ سوال بسیار خوبیه! در اینجا باید بگم که تخصص های زمینه‌ی الگوریتم نویسی و همچنین مدل های ریاضیاتی و آماری در این مرحله به کمک ما میان. اما یک مثال بسیار ساده می‌تونه مثال تشخیص پرتقال و سیب که در مطلب قبلی آورده شده باشه. در این مثال معروف قصد داشتیم یک برنامه‌ای طراحی کنیم که بتونه پرتقال و سیب رو تشخیص بده. بنابراین در قدم اول مجموعه داده‌ای رو ثبت می‌کردیم که مشخصه های وزن و صافی یا زبری میوه در اون اندازه‌گیری بشه. نکته‌ی مهم در جمع آوری داده هایی که می‌خواهیم بر روی آن ها مدل های یادگیری تحت نظارت رو اجرا کنیم اینه که داده ها "دارای برچسب" هستند. در این مثال خاص من علاوه بر این که ویژگی های صافی یا زبری و وزن میوه رو ثبت می‌کنم؛ باید اسم میوه(پرتقال یا سیب) رو هم ثبت کنم.

بنابراین در یادگیری تحت نظارت این مهمه که داده­ ها "برچسب" داشته ­باشند و این مجموعه‌ داده ­های برچسب­­ گذاری ­شده چگونه باشند.

پس از جمع­ آوری داده، داده­ ها طبق این برچسب­ ها طبقه‌بندی می­‌شند. ما در یادگیری تحت نظارت می‌­دانیم طبقه­ بندی­ ها به چه صورته، چون داده­ ها دارای برچسب هستند؛ در صورتی که در یادگیری بدون نظارت عکس این قضیه اتفاق میوفته. درواقع در یادگیری بدون نظارت به مدل اجازه می‌دیم که خودش کار بکنه و اطلاعات رو کشف بکنه که ممکنه این عمل از چشم انسان دور باشه.

در یادگیری بدون نظارت از الگوریتم­ ها و مدل های یادگیری ماشین استفاده می‌­شود که ماشین روی داده ­های بدون برچسب نتیجه ­گیری می­‌کند.

مقایسه یادگیری تحت نظارت و بدون نظارت

یادگیری بدون نظارت الگوریتم­ های بسیار سخت­ تری از یادگیری تحت نظارت داره. چرا که ما اطلاعات کمی در مورد داده­ ها یا نتایج مورد انتظار داریم. در یادگیری بدون نظارت به دنبال چیزهایی می‌­گردیم که بتونیم با آن‌ها گروه تشکیل بدیم یا خوشه­‌بندی کنیم، برآورد تراکم انجام دهیم و در نهایت ابعاد رو کاهش بدیم. در مقایسه­‌ی این دو نوع یادگیری، یادگیری بدون نظارت دارای آزمایش­ ها و مدل­ های کمتری هست که برای اطمینان از دقت مدل استفاده می‌شه.