یکی از مفاهیم ابتدایی تو هوش مصنوعی End-to-End Learning است که تو شبکههای عمیق استفاده میشه، تو این نوشته سعی میکنم یه مرورو مختصری به این موضوع داشته باشم.
فرض کنید ما یک پروژه تشخیص گفتار (speech recognition) داریم و میخواهیم صوت ورودی کاربر رو به متن تبدیل کنیم، تو روشهای سنتی مدل رو به چند ماژول کوچکتر تقسیم میکنند، همونطور که تو شکل 1 میبینید، ابتدا سعی میکنند که از صوت ورودی ویژگی استخراج کنند، سپس این ویژگیها را به آوا تبدیل کنند و در انتها لغات را براساس این آواها تشخیص دهند.
هریک از این ماژولها وظیفه مشخصی را برعهده دارند و برای هر بخش نیاز به الگوریتمهای متفاوتی است، برای بالا بردن دقت نیاز است هرکدام از این ماژولها به صورت جداگانه مورد ارزیابی قرار گرفته و ارتقا پیدا کنند سپس تاثیر آن ماژول بر عملکرد نهایی مورد ارزیابی قرار گیرد. بهبود هریک از این ماژولها به صورت جداگانه زمانبر خواهد بود.
همچنین عمل بهینهسازی هر ماژول به صورت مستقل صورت میگیره و ماژولها تاثیر چندانی بر بهبود یکدیگر ندارند.
تو سالهای اخیر و با پیشرفت یادگیری عمیق مدلهای End-to-End تو بخشهای مختلفی مثل ترجمه ماشینی، پردازش تصویر مورد استفاده قرار گرفته است، ایده مدلهای End-to-End اینه که ما میتونیم تمام این ماژولها رو با استفاده از لایههای مختلف تو دیپلرنینگ پیادهسازی کنیم و عمل یادگیری رو انجام بدیم.
یعنی دیگه مراحلی که تو شکل 1 برای تشخیص گفتار بود رو نداریم و به جای اون یه مدلی داریم که صوت رو به عنوان ورودی میگیره و در خروجی متن تبدیل شده رو به ما تحویل میده. در این روش عمل بهینه سازی به صورت کلی روی سیستم صورت میگیره. که طبق آزمایشات انجام شده رو تسکهای مختلف این روشها عملکرد بهتری نسبت به مدلهای سنتی از خودش نشون دادن.
یکی دیگه از مزیتهای سیستمهای end-to-end این که شما برای پیادهسازیشون برای یک پروژه نیاز به دانش خیلی عمیقی در اون بخش نیاز ندارین، مثلا اگر بخواهید تسک تشخیص گفتار رو با سیستمهای end-to-end انجام بدیم شما نیازی به دونستن چگونگی استخراج فیچرها از صوت نخواهید داشت. و فقط کافیه بردار ورودی رو به مدلتون بدین و عمل آموزش صورت بگیره، پس از آموزش، مدل ویژگیهای مهم رو شناسایی میکند.
این مدلها در کنار نتایج فوقالعادهای که نشون دادند، ضعفهایی هم دارند
1. به دادههای فراوانی نیاز دارند، در روشهای سنتی ما به دانش پیشین فراوانی نیاز داریم اما در این مدلها ما دانش پیشین رو نداریم و برای آموزش بهتر نیاز به دادههای زیادی خواهیم داشت. در بسیاری از تسکها هنگامی که حجم داده آموزش کم باشد مدلهای سنتی عملکرد بهتری از خود نشان میدهند اما اگر حجم دادهها مناسب باشد مدلهای E2E عملکرد بسیار بهتری از خود نشان میدهند.
2. اگر تغییری در دیتاست صورت بگیرد مثلا ابعاد دادههای ورودی تغییر کند، در مدلهای سنتی فقط نیاز بود ماژول او تغییر کند اما در این مدلها نیاز است تمام سیستم دچار تغییر گردد.
تو این مقاله سعی کردم به صورت خیلی ساده E2E رو توضیح بدم برای درک عمیقتر میتونید مقاله زیر رو هم مطالعه کنید.
https://towardsdatascience.com/e2e-the-every-purpose-ml-method-5d4f20dafee4
امیدوارم براتون مفید بوده باشه