فرض کنید که کامپیوتر یک بچه است و ما ناظر (supervisor) او، به طور مثال والد یا معلم هستیم. ما میخواهیم به این کودک یاد بدهیم که یک خروس چه شکلی است. برای این کار، ما تعدادی عکس که بعضی از آنها عکس خروس، و بعضی حیوانات دیگری هستند به کامپیوتر نشان میدهیم. وقتی که ما عکس خروس را نشان میدهیم، جمله «این خروس است» را صدا میزنیم و وقتی عکسهایی که خروس نیستند را نشان میدهیم، جمله «این خروس نیست» را میگوییم. به این روش یادگیری، یادگیری نظارتشده (supervised learning) میگوییم.
در این نوع از یادگیری، نمونههایی که برای آموزش الگوریتم استفاده میشوند، دارای برچسب هستند. به این معنا که مدل یادگیریماشین با استفاده از دادههایی که از قبل برچسب مشخصی دارند ("خروس بودن" و "خروس نبودن" در این مسئله، برچسبهای داده هستند)، الگوهای اساسی را تا زمانی که به دقت رضایتبخشی برای ما برسد، پیدا میکند.
به دلیل اینکه الگوریتم مورد نظر ما با استفاده از دادههایی که دارای برچسب مشخصی هستند الگوهای لازم را پیدا میکند، به این دسته، یادگیری نظارتشده میگویند.
الگوریتمهای یادگیری نظارتشده، به دو دسته طبقهبندی (classification) و رگرسیون (regression) دستهبندی میشوند.
در طبقهبندی، هدف ما پیدا کردن برچسب یا دسته مناسب برای نمونههای بدون برچسب میباشد. برای این کار، ما مدل یادگیری ماشینی را با استفاده از نمونههای برچسبدار، آموزش میدهیم. بهترین مثال برای درک بهتر طبقهبندی، فیلتر کردن ایمیلها به دو دسته اسپم و غیر اسپم است.
در رگرسیون، هدف ما تخمین مقدار یک ویژگی (این بار مقداری پیوسته) برای یک نمونه میباشد. این الگوریتمها برای پیشبینی روند بازار، قیمت خانه و دیگر مثالها به کار میروند.