زیر برازش (Underfitting): زیر برازش زمانی رخ میدهد که مدل یادگیری ماشین بسیار ساده هست که بتواند ساختار داده را دریافت و درک کند. به خوبی بر روی مجموعه آموزشی کارایی ندارد و همچنین بر روی دادههای دیده نشده ( مجموعه اعتبار سنجی یا آزمون) ضعیف عمل میکند. تمام این موارد بخاطر ظرفیت کم مدل و پیچیدگی آن در تحلیل داده است.
*دلایل رخداد آن: ۱) استفاده از مدل ساده با پارامترهای کمتر. ۲) آموزش نامناسب یا تعداد مرتبههای کم جهت آموزش. ۳) استفاده از regularization اضافی که سبب جریمه بیشتر مدل و کاهش پیچیدگی آن میشود.
*نشانههای رخداد آن: ۱) خطای بالا در آموزش ۲) خطای بالا در مجوعه اعتبار سنجی ۳) عملکرد ضعیف در مواجه شدن با دادههای جدید
*چگونه آن را بر طرف کنیم؟ ۱) پیچیدگی مدل را با اضافه کردن پارامترهای بیشتر یا معماری پیچیدهتر افزایش دهیم. ۲) مدل را برای دورههای بیشتر آموزش دهیم. ۳) مقدار regularization را کاهش دهیم یا به طور کامل آن را حذف کنیم. ۴) استفاده از ویژگیهای مرتبط بیشتر یا پیش پردازش داده به صورت متفاوت.
فرا برازش (Overfitting): زمانی رخ میدهد که مدل بیش از حد پیچیده هست و مقادیر نویز بیشتری نسبت به الگوهای اساسی دریافت و درک میکند. همانطور که عملکرد خوبی بر روی مجموعه آموزش دارد، ولی عملکرد آن در مواجه شدن با دادههای جدید به طرز قابل توجهی کاهش مییابد. در واقع مدل مجموعه آموزش را به خوبی یاد گرفته است.
*دلایل رخداد آن: ۱) استفاده از مدل پیچیده همراه با پارامترهای بسیار ۲) آموزش مدل در مرتبههای زیاد ۳) فقدان و نبود regularization، که همین امر سبب میشود تا مدل با نویز عجین شده و بر اساس آن برازش شود.
*نشانههای رخداد آن: ۱) خطای آموزش کم ۲) خطای اعتبار سنجی زیاد ۳) عملکرد ضعیف مدل در مواجه شدن با دادههای جدید
*چگونه آن را برطرف کنیم؟ ۱) کاهش پیچیدگی مدل با استفاده از مدل سادهتر یا محدود کردن پارامترها ۲) به کار گیری تکنیکهایی همچون L1 و L2 که جزو regularization ها هستند. ۳) افزایش حجم مجموعههای آموزش به منظور دید مفهومیتر از الگوهای اساسی. ۴) استفاده از تکنیکهایی همچون cross-validation به منظور کارایی بهتر مدل و جلوگیری از فرا برازش.
هدف در اینجا ایجاد یک تعادلی بین زیر برازش و فرابرازش هست که به عنوان بده بستان "bias-variance" شناخته میشود. در واقع پیچیدگی مدل باید آنگونه باشد که الگوهای اساسی را درک کند و بر اساس نویز برازش نشود.