یک روش ترجمه چند زبانه دقیق و حساس به زبان

۵۷‌امین کنفرانس سالانه انجمن زبان‌شناسی رایانشی
۵۷‌امین کنفرانس سالانه انجمن زبان‌شناسی رایانشی

​​​​​​​​​​​​​​

ترجمه ماشینی عصبی چند زبانه (‏مولتی - ان‌ام‌تی) ‏با یک مدل کدگذار-کدگشا به دلیل پیاده‌سازی ساده آن پیشرفت قابل‌توجهی داشته‌ است. با این حال، این الگوی ترجمه چندزبانه استفاده کاملی از اشتراکات زبانی و به اشتراک‌گذاری پارامتر بین رمزگذار و رمزگشا نمی‌کند. علاوه بر این، این نوع الگو نمی‌تواند در بیشتر موارد بهتر از مدل‌های مستقل آموزش‌دیده بر روی پیکره دوزبانه عمل کند. در این مقاله، ما یک روش فشرده و حساس به زبان را برای ترجمه چند زبانه پیشنهاد می‌کنیم. برای به حداکثر رساندن به اشتراک گذاری پارامتر، ما ابتدا یک نمایش عمومی را ارایه می‌دهیم که جایگزین مدل‌های کدگذار و کدگشا می‌شود. برای اینکه حساسیت را برای زبان‌های خاص ایجاد کنیم، بیشتر به معرفی ویژگی‌های حساس به زبان، توجه، و تفکیک‌کننده با توانایی بهبود عملکرد مدل می‌پردازیم. ما روش‌های خود را در سناریوهای مختلف ترجمه، از جمله یک به بسیار، بسیار به بسیار و برداشت صفر، بررسی می‌کنیم. آزمایش‌های گسترده نشان می‌دهد که روش‌های پیشنهادی ما به طور قابل‌توجهی بهتر از سیستم‌های ترجمه چند زبانه استاندارد قوی در مجموعه داده‌های WMT و IWSLT عمل می‌کنند. علاوه بر این، ما متوجه شدیم که مدل ما به ویژه در سناریوهای با منابع پایین و ترجمه با برداشت صفر مفید است. ​

این متن ترجمه‌ای ‌خودکار از چکیده مقاله A Compact and Language-Sensitive Multilingual Translation Method ارایه شده در ۵۷‌امین کنفرانس سالانه Association for Computational Linguistics است.

برای مطالعه کامل این مقاله به همراه ترجمه‌ آنلاین و رایگان به این لینک مراجعه فرمایید.​