یادگیری دوگان (Dual Learning) یکی از مباحثی است که از سال ۲۰۱۶ وارد حوزه یادگیری ماشین شده است. یکی از مهمترین استفادههایی که از این نوع یادگیری شده، مربوط به مقالهای است که سعی دارد ترجمه ماشینی را بهوسیله این روش بهبود ببخشد. در ادامه باهم به بررسی این مقاله میپردازیم.
یکی از مشکلاتی که درزمینه ترجمه ماشینی بسیار حائز اهمیت است، کمبود دادههای دوزبانه (bilingual data) است. تهیه کردن این دادهها و جمعآوری آنها هزینهبر است. یکی از کارهای مفیدی که این مقاله موفق به انجام آن شده است این است که با حجم کم از این دادهها موفق شده که بهدقت الگوریتمهای قبل از خود برسد.
اگر بخواهیم که یک مرور بر الگوریتم این مقاله داشته باشیم،میتوان آن را در چند مرحله خلاصه کرد:
الگوریتم پیشنهادی مقاله درواقع بدین شکل است:
اگر در شمای الگوریتم دقت کنیم میتوانیم این نکته را دریابیم که درواقع الگوریتم دو نوع پارامتر را جهت مقایسه استفاده کرده است.
نویسندگان مقاله الگوریتم پیشنهادی خود را بر روی دادههای دوزبانه انگیلسی-فرانسه تست کردهاند و نتایجی که با استفاده از 10 درصد کل دادههای دو زبانه برای آموزش گرفتهاند، بهدقت الگوریتمهای قبلی که از تمام این دادهها استفاده کردهاند، رسیده است. یک نمونه از این نتایج را میتوانید در شکل زیر ببینید:
اصل مقاله را می توانید از اینجا دانلود کنید.
مترجم: سعید بیباک