خواندن ۲ دقیقه·۱ سال پیش

زیر برازش و فرا برازش در یادگیری ماشین

زیر برازش (Underfitting): زیر برازش زمانی رخ می‌دهد که مدل یادگیری ماشین بسیار ساده هست که بتواند ساختار داده را دریافت و درک کند. به خوبی بر روی مجموعه آموزشی کارایی ندارد و همچنین بر روی داده‌های دیده نشده ( مجموعه اعتبار سنجی یا آزمون) ضعیف عمل می‌کند. تمام این موارد بخاطر ظرفیت کم مدل و پیچیدگی آن در تحلیل داده است.

*دلایل رخداد آن: ۱) استفاده از مدل ساده با پارامتر‌های کمتر. ۲) آموزش نامناسب یا تعداد مرتبه‌های کم جهت آموزش. ۳) استفاده از regularization اضافی که سبب جریمه بیشتر مدل و کاهش پیچیدگی آن می‌شود.

*نشانه‌های رخداد آن: ۱) خطای بالا در آموزش ۲) خطای بالا در مجوعه اعتبار سنجی ۳) عملکرد ضعیف در مواجه شدن با داده‌های جدید

*چگونه آن را بر طرف کنیم؟ ۱) پیچیدگی مدل را با اضافه کردن پارامترهای بیشتر یا معماری پیچیده‌تر افزایش دهیم. ۲) مدل را برای دوره‌های بیشتر آموزش دهیم. ۳) مقدار ‌regularization را کاهش دهیم یا به طور کامل آن را حذف کنیم. ۴) استفاده از ویژگی‌های مرتبط بیشتر یا پیش پردازش داده به صورت متفاوت.

فرا برازش (Overfitting): زمانی رخ می‌دهد که مدل بیش از حد پیچیده هست و مقادیر نویز بیشتری نسبت به الگو‌های اساسی دریافت و درک می‌کند. همانطور که عملکرد خوبی بر روی مجموعه آموزش دارد، ولی عملکرد آن در مواجه شدن با داده‌های جدید به طرز قابل توجهی کاهش می‌یابد. در واقع مدل مجموعه آموزش را به خوبی یاد گرفته است.

*دلایل رخداد آن: ۱) استفاده از مدل پیچیده همراه با پارامترهای بسیار ۲) آموزش مدل در مرتبه‌های زیاد ۳) فقدان و نبود regularization، که همین امر سبب می‌شود تا مدل با نویز عجین شده و بر اساس آن برازش شود.

*نشانه‌های رخداد آن: ۱) خطای آموزش کم ۲) خطای اعتبار سنجی زیاد ۳) عملکرد ضعیف مدل در مواجه شدن با داده‌های جدید

*چگونه آن را برطرف کنیم؟ ۱) کاهش پیچیدگی مدل با استفاده از مدل ساده‌تر یا محدود کردن پارامترها ۲) به کار گیری تکنیک‌هایی همچون L1 و L2 که جزو regularization ها هستند. ۳) افزایش حجم مجموعه‌های آموزش به منظور دید مفهومی‌تر از الگوهای اساسی. ۴) استفاده از تکنیک‌هایی همچون cross-validation به منظور کارایی بهتر مدل و جلوگیری از فرا برازش.

هدف در اینجا ایجاد یک تعادلی بین زیر برازش و فرابرازش هست که به عنوان بده بستان "bias-variance" شناخته می‌شود. در واقع پیچیدگی مدل باید آنگونه باشد که الگوهای اساسی را درک کند و بر اساس نویز برازش نشود.

یادگیری ماشیناعتبار سنجیoverfittingunderfitting

آکادمی ساینس آرمان

آکادمی ساینس آرمان یک بستر مناسب جهت آموزش مفاهیم و کاربرد‌های واقعی آنها در حوزه‌های هوش مصنوعی و توسعه وب هست. این پلتفرم آموزشی توسط آرمان دانش دوست تاسیس شده است.

شاید از این پست‌ها خوشتان بیاید