امیرحسین مجد
امیرحسین مجد
خواندن ۲ دقیقه·۳ سال پیش

مثال در دنیای واقعی براي بيش برازش و كم برازش

مثال هاي متنوعي ميتوان براي Over-fittingدر نظر گرفت فرض كنيد شما فردا امتحان داريد و مياييد تمام نمونه سوالهاي سالهاي قبل رو ميخونيد ، بجاي اينكه منبع اصلي رو بخونيد و نمونه سوالهاي قبلي رو ياد ميگيريد اما فردا سر امتحان نمونه سوال ها فرق ميكنه و اينجا شما Over-fitting ميشد و خيلي راحت با توجه به اينكه كلي هم وقت گذاشتيد و مثلا درس خوندين و خودتون رو براي امتحان اماده كردين، اما براي سوال هايي كه اگر، مثل سوال هاي قبلي باشه و در غير اين صورت نميتونيد جواب بدين.

درواقعOver-fitting به این موضوع اشاره دارد که مدل ما بسیار خوب آموزش دیده است اما به خوبی تعمیم نیافته است. اجازه دهید با یک مثال واقعی پیش برویم.فرض کنید شما به یک کشور خارجی رفته اید و قصد دارید با تاکسی به جایی بروید و از بد روزگار راننده آن تاکسی شما را تلکه می کند و پول زیادی از شما می گیرد و در نهایت شما می گویید تمامی رانندگان تاکسی آن کشور دزد هستند. Over-generalization یا Over-fitting دقیقا همین چیزی است که در زندگی انسان ها در حال رخ دادن است و جالب است بدانید که ماشین نیز ممکن است در این دام بیفتد اگر به خوبی مراقب عملکردتان نباشید. بنابراین تعریف Over-fit را اینگونه می گوییم که بسیار خوب آموزش دیده است اما قدرت تعمیم پذیری یا Generalization ندارد.

براي مفهوم under fitting هم مثال هاي خيلي زيادي در دنياي واقعي ميتوان پيدا كرد كه اكثرا به اينصورت هستتند كه شما بايكسري اطلاعات كم يه چيزي ياد ميگيرين و بعد وقتي داده هاي زياد تر با مشحصات بالاتر مياد شما قشنگ نميتونيد انها را تشخيص بدين يا بفهمين مثلا به شما فقط درخت زردالو نشون ميدن و درخت هاي ميوه ديگري رو نشون نميدن بعد شمارو ميبرن داخل يك باغ با درخت هاي ميوه متنوع اينجاس كه شما اندر فيت ميشي

فرض کنید سه دانش آموز برای امتحان ریاضی آماده شده اند. دانش آموز اول فقط عملیات ریاضی جمع را مطالعه کرده و از سایر عملیات ریاضی مانند تفریق، تقسیم، ضرب و غیره صرف نظر کرده است. دانش آموز دوم حافظه خوبی دارد. بدین ترتیب دانش آموز دوم تمام مسائل ارائه شده در کتاب درسی را حفظ کرده است. و دانش آموز سوم تمام عملیات ریاضی را خوانده و به خوبی برای امتحان آماده شده است. دانش آموز در امتحان فقط می تواند سوالات مربوط به جمع را حل کند و در مسائل یا سوالات مربوط به سایر عملیات ریاضی مردود می شود. دانش آموز دو تنها در صورتی قادر به پاسخگویی به سؤالات خواهد بود که به صورت اتفاقی در کتاب درسی آمده باشد (همانطور که او آن را حفظ کرده است) و نمی تواند به سؤالات دیگری پاسخ دهد. دانش آموز سه می تواند تمام مسائل امتحان را به خوبی حل کند. الگوریتم های یادگیری ماشین رفتاری مشابه با سه دانش آموز ما دارند، گاهی اوقات مدل تولید شده توسط الگوریتم مشابه دانش آموز اول است. آنها فقط از بخش کوچکی از مجموعه داده آموزشی یاد می گیرند، در چنین مواردی مدل Underfitting است

شاید از این پست‌ها خوشتان بیاید