موتور ترجمه جدید ترگمان راه‌اندازی شد!

ترگمان اولین موتور ترجمه ماشینی مبتنی بر مدل آماری در کشوره که در حدود ۱۱ سال پیش راه‌اندازی شد. ظهور مدل‌های آماری در اون زمان، انقلابی در صنعت ترجمه به شمار می‌رفت، اما با این وجود کیفیت مطلوبی نداشتند. به‌محض اینکه مدل‌های مبتنی بر شبکه عصبی(نورونی) معرفی شدند، ما موتور ترجمه ترگمان رو برای ترجمه متون انگلیسی فارسی از آماری به نورونی ارتقا دادیم و دو هفته پیش از اینکه گوگل موتور ترجمه‌ی فارسی انگلیسی نورونی خودش رو معرفی کنه- موتور ترجمه‌ ماشینی نورونی ترگمان ارائه شد. البته موتورهای گوگل برای ترجمه‌ی جفت‌زبان‌های دیگه‌ای مثل چینی-انگلیسی چندماهی پیش‌تر ارائه شده بودند. استفاده از مدل‌های نورونی سبب بهبود کیفیت ترجمه‌ها و افزایش سطح کیفیت مترجم ترگمان نسبت به گوگل برای جفت زبان انگلیسی به فارسی شد. همچنین استقبال خوب از موتور ترجمه ترگمان موجب شد تا مهم‌ترین محصول خودمون یعنی ترجمیار رو با استفاده از این مدل‌ها بر روی مقالات علمی آموزش بدیم تا کیفیت ترجمه مطلوبی برای مقالات علمی ارائه بشه.

آخرین جهش کیفی در موتورهای ترجمه‌ی ماشینی با معرفی مدل‌های «ترانسفورمر» در سال ۲۰۱۷ اتفاق افتاد. این مدل‌ها در حال حاضر آخرین تکنولوژی موجود در صنعت ترجمه هستند که به‌طور گسترده‌ای در سراسر دنیا و برای بسیاری از زبان‌ها استفاده می‌شوند. نتیجه تحقیقات و آزمایشات ما در ترگمان منجر به آموزش موفق مدل ترانسفورمر برای ترجمه متون انگلیسی به فارسی و برعکس اون شد. اولین بار حدود ۴ سال پیش این مدل رو در ترجمیار و برای مقالات علمی راه‌اندازی کردیم که با استقبال گسترده‌ای روبرو شد. با این وجود تا همین چندی پیش، محدودیت‌های سخت‌افزاری بهمون اجازه نمی‌داد که از موتور ترانسفورمر ترگمان برای سرویس‌دهی استفاده کنیم. مساله این بود که مدل‌های ترانسفورمر برای آموزش و سرویس‌دهی نیاز به پردازنده‌های قوی گرافیکی(GPU) داشتند که با توجه به محدودیتی که داشتیم (و همچنان با بیشتر اونا روبرو هستیم)، امکان برخط کردن موتور ترانسفورمر ترگمان نبود اما هم‌اکنون، با بهره‌گیری از روش‌هایی که با کوچک‌تر کردن سایز مدل‌ها امکان استفاده از CPU(بجای GPU) رو برای سرویس‌دهی فراهم کردن، مفتخریم که اعلام کنیم که ترگمان هم به آخرین تکنولوژی روز مجهز شد.

ویژگی‌های موتور جدید ترگمان

در نسخه‌ جدید ترگمان، کیفیت ترجمه‌ها به‌طور کلی ارتقا یافتن. هم گزینش کلمات برای تولید ترجمه نسبت به قبل بهتر شده و هم روان بودن متن و کفایت معنایی بهبود پیدا کرده. علاوه بر این موارد برای اینکه کیفیت ترجمه تو حوزه ادبیات فنی جدید هم مناسب باشه، در پیکره‌ی آموزشی از داده‌های به‌روز حوزه‌ تکنولوژی استفاده کردیم. همچنین حجم زیادی از پیکره‌های خبری رو هم وارد فرایند آموزش کردیم که اگر به واژگان و نوع نگارش جمله‌های خروجی دقت کنید، این سبک نگارش خبری به‌وضوح در ترجمه‌ها احساس می‌شه. از طرف دیگه، استفاده از حجم داده زیاد برای آموزش موتور، سبب شد که طیف کلمات مورد استفاده توسط موتور هم بالا بره. همه‌ی این‌ها رو ما گفتیم ولی خب! مشکآن است که خود ببوید نه آنکه عطار بگوید. برای همین از شما دعوت می‌کنیم که همین حالا با مراجعه به سایت ترگمان نسخه‌ به‌روز شده‌ی موتور ترگمان رو آزمایش کنید.

در ادامه چند مثال جالب از برتری عملکرد موتور ترجمه ترگمان نسبت به گوگل‌ترنسلیت با توجه به کیفیت اون رو مشاهده می‌کنید.

شکل۱. مقایسه عملکرد موتور ترجمه ترگمان و گوگل مثال ۱
شکل۱. مقایسه عملکرد موتور ترجمه ترگمان و گوگل مثال ۱
شکل۲. مقایسه عملکرد موتور ترجمه ترگمان و گوگل مثال ۲
شکل۲. مقایسه عملکرد موتور ترجمه ترگمان و گوگل مثال ۲

رشد روزافزون تعداد کاربران مهر تاییدی بر کیفیت مطلوب این سرویس هست و این موضوع حدود یک سال قبل با برملا شدن استفاده گوگل از ترگمان بیش از پیش عیان شد. (می‌تونید ماجرای استفاده گوگل از ترگمان رو اینجا بخونید.)

https://blog.targoman.ir/%D9%85%D8%A7%D8%AC%D8%B1%D8%A7%DB%8C-%D8%A7%D8%B3%D8%AA%D9%81%D8%A7%D8%AF%D9%87-%DA%AF%D9%88%DA%AF%D9%84-%D8%A7%D8%B2-%D8%AA%D8%B1%DA%AF%D9%85%D8%A7%D9%86-wrpomhzongqu

امروز، ترگمان با پشت سر گذاشتن مشکلات و محدودیت‌های سخت‌افزاری و تلاش‌های بی‌وقفه با ارتقا سطح کیفی موتور ترجمه بومی جایگاه خودش رو تثبیت کرده و رسیدن به آمار ترجمه ۷۲ میلیون کلمه در یک روز! اثباتی بر این گفته است. ما همواره تلاش داشته‌ایم تا بدون فیلترینگ و تبلیغات فاصله خودمون رو با گوگل حفظ کنیم. اگر اشکالی چیزی در سرویس دیدید یا پیشنهادی برای بهبود داشتید باهامون در میون بذارید.