ترجمه ماشینی به‌وسیله یادگیری دوگان (Dual learning)

یادگیری دوگان( Dual Learning )یکی از مباحثی است که از سال ۲۰۱۶ وارد حوزه یادگیری ماشین شده است. یکی از مهم‌ترین استفاده‌هایی که از این نوع یادگیری شده،‌ مربوط به مقاله‌ای است که سعی دارد ترجمه ماشینی را به‌وسیله این روش بهبود ببخشد. در ادامه باهم به بررسی این مقاله می‌پردازیم.

یکی از مشکلاتی که درزمینه ترجمه ماشینی بسیار حائز اهمیت است،‌ کمبود داده‌های دوزبانه (bilingual data) است. تهیه کردن این داده‌ها و جمع‌آوری آن‌ها هزینه‌بر است. یکی از کارهای مفیدی که این مقاله موفق به انجام آن شده است این است که با حجم کم از این داده‌ها موفق شده که به‌دقت الگوریتم‌های قبل از خود برسد.

اگر بخواهیم که یک مرور بر الگوریتم این مقاله داشته باشیم،می‌توان آن را در چند مرحله خلاصه کرد:‌

  1. عامل شماره 1 که تنها زبان آ را می‌شناسد،‌ یک پیام در این زبان را به‌وسیله یک کانال با اغتشاش که شامل مدل ترجمه کننده زبان آ به زبان ب نیز می‌باشد،‌ به عامل شماره 2 ارسال می‌کند.
  2. عامل شماره 2 که تنها زبان ب را می‌شناسد،‌ در ابتدا چک می‌کند که آیا جمله دریافت شده یک جمله معتبر در زبان ب هست یا خیر. اگر این جمله معتبر بود،آنگاه جمله دریافتی را به‌وسیله کانال دارای اغتشاش دومی که شامل مدل ترجمه کننده زبان ب به زبان آ است،‌ به عامل آ ارسال می‌کند.
  3. عامل آ نیز مانند عامل ب،‌ ابتدا جمله را چک می‌کند که در زبان خودش معتبر است یا نه. و سپس با استفاده از تفاوت بین پیامی که دریافت کرده و پیامی که فرستاده کانال ها و مدل های ترجمه متناظر را تصحیح میکند. و درنهایت جمله را توسط کانال به عامل ب می‌فرستد.
  4. در ادامه عامل ب نیز با دریافت دومین ورودی خود، سعی می‌کند که کانال‌ها را تصحیح کند.
  5. این رفت‌وبرگشت پیام و تصحیح کانال‌ها تا زمانی که مقدار خطابه حد مشخصی برسد،ادامه پیدا خواهد کرد.

الگوریتم پیشنهادی مقاله درواقع بدین شکل است:

شمای الگوریتم
شمای الگوریتم


اگر در شمای الگوریتم دقت کنیم می‌توانیم این نکته را دریابیم که درواقع الگوریتم دو نوع پارامتر را جهت مقایسه استفاده کرده است.

  1. پارامتری در جهت سنجش روان بودن جملات تولیدی که از آن با Language model reward نام می‌برد.
  2. پارامتری در جهت سنجش کیفیت ترجمه ماشینی که از آن با Communication reward نام می‌برد.


نویسندگان مقاله الگوریتم پیشنهادی خود را بر روی داده‌های دوزبانه انگیلسی-فرانسه تست کرده‌اند و نتایجی که با استفاده از 10 درصد کل داده‌های دو زبانه برای آموزش گرفته‌اند،‌ به‌دقت الگوریتم‌های قبلی که از تمام این داده‌ها استفاده کرده‌اند،‌ رسیده است. یک نمونه از این نتایج را می‌توانید در شکل زیر ببینید:

نتایج  یادگیری دوگانه برای ترجمه ماشینی انگلیسی و فرانسه
نتایج یادگیری دوگانه برای ترجمه ماشینی انگلیسی و فرانسه


اصل مقاله را می توانید از اینجا دانلود کنید.

مترجم: سعید بی‌باک