به نام خدا
(سوال مصاحبه دکترا 1401)
در آموزش مدل های یادگیری ماشین، به مدلی می گوییم مدل خوبی است که در نهایت برای داده های جدیدی که در آن حوزه ی مسئله ی خاص وجود دارد بتواند مقادیر مناسبی پیش بینی کند یا به عبارتی قدرت تعمیم خوبی داشته باشد.
براساس میزان تعمیم مدل، 3 حالت ممکن است پیش آید:
تصویر بالا این سه حالت را نمایش می دهد.
حالت underfitting یا کم برازش
حالتی است که مدل ساده است و نتواسته قدرت تعمیم خوبی روی داده ها داشته باشد. مثلا در تصویر بالا، یک خط نمی تواند نماینده ی خوبی برای داده ها باشد و در این حالت اگر داده ی جدیدی داشته باشیم مدل نمی تواند برچسب مناسبی به آن بدهد. در این حالت مدل به اندازه ی کافی آموزش ندیده است.
حالت Good fit
حالت مناسب و ایده آلی است که مدل به خوبی آموزش دیده و تعمیم خوبی برای داده های جدید دارد.
حالت overfitting یا بیش برازش
در این حالت، مدل داده های train را حفظ کرده و کاملا به آن ها fit شده است. اینجاست که مدل برای داده های جدید قابلیت تعمیمش را از دست می دهد و نمی تواند پیش بینی درستی داشته باشد. اگر بخواهیم مثال ملموس تری از این حالت بیان کنیم، مدل مثل دانش آموزی است که سوالات و پاسخ های یک جزوه ی ریاضی را حفظ کرده است و اگر در جلسه ی امتحان سوالات کمی تغییر کنند این دانش آموز نمی تواند به سوالات پاسخ دهد زیرا سوالات خاصی را حفظ کرده است.
در زمان train حالت overfitting را با مشاهده ی مقدار loss می توان تشخیص داد. در شکل زیر این حالت نشان داده شده است. اگر میزان خطای train در حال کاهش باشد اما خطا روی داده های validation در حال افزایش باشد و میزان آن از خطای train بیشتر باشد می توان گفت بیش برازش اتفاق افتاده است.
از طرفی دقت یا Accuracy نیز در این حالت روی داده های train نسبت به داده های validation بیشتر خواهد بود.