آشنایی با یادگیری ماشین با نظارت و کاربردهای آن

همانطور که در مقاله “یادگیری ماشین چیست و چه کاربردهایی در زندگی ما دارد؟“ اشاره کردیم، ماشین لرنینگ علمی است که یک ماشین یا سیستم را قادر می سازد تا به کمک تجربه و تکرار و بدون کدنویسی و استفاده از دستورات شرطی، مطالب مختلف را یاد بگیرند. همچنین آموختیم که علم ماشین لرنینگ شامل سه گروه اصلی یادگیری ماشین با نظارت، یادگیری بدون نظارت و یادگیری نیمه نظارتی می شود.

در این مقاله قصد داریم به طور دقیق تر به مبحث یادگیری با نظارت بپردازیم و ضمن آشنایی با آن، با برخی از کاربردهای این روش آشنا شویم.

یادگیری با نظارت چیست؟

یادگیری ماشین با نظارت، Supervised learning یا یادگیری نظارت شده، یکی از زیرمجموعه های یادگیری ماشین است که بر اساس مجموعه داده های ورودی و خروجی، سیستم را برای یادگیری یک موضوع آماده می کند. متخصصا ن ماشین لرنینگ، معمولا برای آموزش نظارت شده به ماشین از دو دسته داده به نام های داده های آموزشی و داده های تست استفاده می کنند.

فاز اول Supervised learning، استفاده از داده آموزشی

در یادگیری ماشین با نظارت برای آموزش به سیستم از داده ها و اطلاعاتی استفاده می شود که پاسخ آن ها برای سیستم مشخص است. مثلا اگر سیستم برای تشخیص اشکال مربعی شکل طراحی شده باشد، مجموعه داده، شامل اشکال مربع، مثلث، دایره، لوزی و… است که مربع بودن یا نبودن هرکدام از این داده ها با برچسب (label) های 0 و 1 مشخص می شود. بدین ترتیب پس از ورود هر داده (در اینجا شکل هندسی) به سیستم و مشاهده برچسب آن، ماشین متوجه می شود که شکل مورد نظر مربع است (برچسب 1) یا مربع نیست (برچسب 0).

ماشین با دریافت تعداد زیادی تصویر از اشکال هندسی مختلف، به صورت خودکار برای خود تابعی تشکیل می دهد که به کمک آن بتواند شکل مربع را تشخیص دهد. در این زمان آموزش تکمیل شده است.

فاز دوم، تست سیستم

پس از اینکه آموزش به ماشین به اتمام رسید، نوبت به امتحان گرفتن و تست سیستم است. در این مرحله محققان مجموعه داده ای تهیه می کنند که برچسب داده های آن مشخص است. اما تنها داده ها را (بدون برچسب هایشان) وارد سیستم می کنند تا بسنجند که سیستم تا چه حد قادر به ارائه خروجی صحیح است.

در همین مثال اشکال هندسی، وقتی چندین شکل مختلف و بدون برچسب در اختیار سیستم قرار داده شد، ماشین بر اساس آموخته های قبلی خود اشکال را در دو گروه مربع و غیر مربع قرار می دهد. سپس طراحان سیستم با توجه به برچسب هایی که در اختیار دارند، نتیجه کار ماشین را می سنجند.

فاز سوم، سنجش

سنجش عملکرد در یادگیری ماشین با نظارت امر مهمی است. زیرا در صورتی که ماشین تمامی اشکال را بدون کوچکترین خطایی دسته بندی کرده باشد، ممکن است اشکال بزرگی به نام Overfitting بوجود آمده باشد و به اصطلاح سیستم به جای یادگیری، داده ها را حفظ کرده باشد. در مورد این مشکل در مطالب آتی صحبت خواهیم کرد.

حالت دوم این است که سیستم خطای قابل توجهی داشته باشد. در این حالت مجددا باید به آموزش ادامه داد. در روش هایی مثل استفاده از شبکه های عصبی، ممکن است با تغییر تعداد لایه ها یادگیری بهبود یابد.

اما در صورتی که سیستم به مقدار منطقی خطا داشت و پاسخ های نسبتا منطقی ومعقولی ارائه نمود، می توان از آن برای اجرای هدف اصلی بهره برداری نمود.

توجه

تشخیص شکل مربع تنها یک مثال است و همین مساله در مورد مسائل بسیار پیچیده تر مثل پیشبینی وضعیت بورس یا پرواز هواپیما در شرایط جوی مختلف نیز قابل پیاده سازی می باشد. یادگیری ماشین با نظارت درست مانند کودک انسان که پس از مشاهده چند نوع لیوان، قادر به تشخیص هر نوع لیوانی در هر رنگ، جنس یا اندازه ای خواهد بود، عمل می کند.

همچنین هر سیستم براساس مساله خاصی طراحی می شود و ممکن است داده ها را به دو یا چند دسته تقسیم کند. در مثال فوق اگر آموزش به نحوی دیگر بود، سیستم می توانست اشکال را در گروه های مربع، مثلث، دایره و… قرار دهد.

یادگیری ماشین با نظارت چه کاربردهایی دارد؟

از Supervised learning در مسائل مختلفی چون فیلتر اسپم ها، تشخیص سرطان، تشخیص تقلب و… استفاده می شود.

معایب یادگیری نظارت شده

بزرگترین ایراد یادگیری ماشین با نظار آن است که داده های جمع آوری شده دارای برچسب نیستند.در نتیجه یک یا چند نیروی انسانی باید یا صرف روزها و یا ماه ها وقت، مجموعه داده ها را برچسب گذاری نمایند. این مساله علاوه بر وقت گیر و هزینه بر بودن، خطای انسانی را نیز در پی خواهد داشت.

منبع