آمار شهید بهشتی خوندم. حوزه فعالیتم دیتاساینسه. عضو کوچیکی از خانوادهی شتابدهنده سنجیده و شرکت علم داده ارزیاب ام. پروفایل من در ارزیاب: https://arz-yab.com/our-teams/personalpage.php?uid=2
یادگیری تحت نظارت و بدون نظارت در یادگیری ماشین در سه دقیقه
توی این مطلب قصد دارم خیلی مختصر supervised learning و unsupervised learning که جزء سرفصل های یادگیری ماشین هستند رو توضیح بدم.
یکی از راه های ساده برای این که با یادگیری تحت نظارت آشنا بشیم اینه که دقیقاً به معنی این کلمه توجه کنیم. تحت نظارت به معنی "با دقت زیر نظر گرفتن" است. با دقت نظاره کردن اجرای یک پروژه، وظیفه یا یک فعالیت.
حالا این سوال به وجود میاد که چطور یک مدل یادگیری ماشین رو تحت نظر میگیریم؟ این کار رو با یاد دادن مدل انجام می دیم. به این صورت که مدل رو با دانش قبلی میسازیم. بنابراین میتونیم نمونه های آینده رو پیش بینی کنیم. اما سوال دیگهای که ایجاد میشه اینه که دقیقاً چطور این مدل رو آموزش می دیم؟ سوال بسیار خوبیه! در اینجا باید بگم که تخصص های زمینهی الگوریتم نویسی و همچنین مدل های ریاضیاتی و آماری در این مرحله به کمک ما میان. اما یک مثال بسیار ساده میتونه مثال تشخیص پرتقال و سیب که در مطلب قبلی آورده شده باشه. در این مثال معروف قصد داشتیم یک برنامهای طراحی کنیم که بتونه پرتقال و سیب رو تشخیص بده. بنابراین در قدم اول مجموعه دادهای رو ثبت میکردیم که مشخصه های وزن و صافی یا زبری میوه در اون اندازهگیری بشه. نکتهی مهم در جمع آوری داده هایی که میخواهیم بر روی آن ها مدل های یادگیری تحت نظارت رو اجرا کنیم اینه که داده ها "دارای برچسب" هستند. در این مثال خاص من علاوه بر این که ویژگی های صافی یا زبری و وزن میوه رو ثبت میکنم؛ باید اسم میوه(پرتقال یا سیب) رو هم ثبت کنم.
بنابراین در یادگیری تحت نظارت این مهمه که داده ها "برچسب" داشته باشند و این مجموعه داده های برچسب گذاری شده چگونه باشند.
پس از جمع آوری داده، داده ها طبق این برچسب ها طبقهبندی میشند. ما در یادگیری تحت نظارت میدانیم طبقه بندی ها به چه صورته، چون داده ها دارای برچسب هستند؛ در صورتی که در یادگیری بدون نظارت عکس این قضیه اتفاق میوفته. درواقع در یادگیری بدون نظارت به مدل اجازه میدیم که خودش کار بکنه و اطلاعات رو کشف بکنه که ممکنه این عمل از چشم انسان دور باشه.
در یادگیری بدون نظارت از الگوریتم ها و مدل های یادگیری ماشین استفاده میشود که ماشین روی داده های بدون برچسب نتیجه گیری میکند.
مقایسه یادگیری تحت نظارت و بدون نظارت
یادگیری بدون نظارت الگوریتم های بسیار سخت تری از یادگیری تحت نظارت داره. چرا که ما اطلاعات کمی در مورد داده ها یا نتایج مورد انتظار داریم. در یادگیری بدون نظارت به دنبال چیزهایی میگردیم که بتونیم با آنها گروه تشکیل بدیم یا خوشهبندی کنیم، برآورد تراکم انجام دهیم و در نهایت ابعاد رو کاهش بدیم. در مقایسهی این دو نوع یادگیری، یادگیری بدون نظارت دارای آزمایش ها و مدل های کمتری هست که برای اطمینان از دقت مدل استفاده میشه.
مطلبی دیگر از این انتشارات
یادگیری ماشین و مدل سازی آماری(شباهت ها و تفاوت ها)
مطلبی دیگر از این انتشارات
الگوریتم های خوشه بندی لوید و فورجی(K-means)
مطلبی دیگر از این انتشارات
خوشه بندی چیست و چگونه عمل میکند؟