سیستم‌های ترجمه به کمک کامپیوتر در مقایسه با ترجمه ماشینی

منتشرشده در Towards Data Science به تاریخ ۱۹ ژوئیه ۲۰۲۰
لینک مقاله اصلی: Computer-Assisted Translation Systems Versus Machine Translation

همه ما با گوگل ترنسلیت آشنا هستیم و احتمالا یک یا چند بار از آن استفاده کرده‌ایم. اما آیا ما واقعا می‌دانیم چه چیزی پشت آن است و صنعت زبان چه استفاده‌ای از ابزارهای ترجمه خودکار می‌کند؟ اگر شما یک فرد یا سهامدار شرکتی هستید و در نظر دارید که از خدمات ترجمه برای اسناد و یا وب سایت خود استفاده کنید، به طور خاص، باید از این فن‌آوری‌ها آگاه باشید تا تصمیم آگاهانه بگیرید.

ابزار ترجمه به کمک کامپیوتر چیست و سیستم مدیریت ترجمه چیست؟

یک ابزار CAT (ترجمه به کمک کامپیوتر) نرم‌افزاری است که مترجمان را در آماده‌سازی ترجمه پشتیبانی می‌کند. این ابزار متن را برای ترجمه شدن تبدیل می‌کند،‌ آن را بخش‌بندی کرده و این بخش‌ها را برای ترجمه در اختیار ویرایشگر خود قرار می‌دهد.

یک ابزار CAT شامل چندین زیر سیستم است. در هسته آن حافظه ترجمه (TM) قرار دارد که واحدهای ترجمه مجزا را در یک پایگاه‌داده جمع‌آوری می‌کند. در طول فرآیند ترجمه، هر یک از واحدهای ترجمه که شامل بخشی از متن مبدا و ترجمه معادل در زبان مقصد هستند، ذخیره می‌شوند. ذخیره واحدهای ترجمه تضمین می‌کند که ترجمه‌ها باقی می‌مانند و همان اصطلاحات در متن به کار می‌روند. این امر کیفیت متن خروجی را بهبود می‌بخشد.

ابزار CAT متن منبع را به بخش‌هایی مانند جملات، لیست‌ها یا سرتیتر تقسیم می‌کند. سپس بخش‌های جداگانه در یک پنجره ویرایشگر به مترجم نمایش داده می‌شوند. مترجم، ترجمه خود را در بخش مربوطه در کنار یا زیر متن مبدا وارد می‌کند. این امر باعث ایجاد واحدهای ترجمه‌ای می‌شود که در حافظه ترجمه ذخیره شده‌اند، که یک پایگاه‌داده دو زبانه حاوی محتوای منبع اصلی و ترجمه متناظر‌ است. هنگامی که مترجم متنی مشابه را در آینده ترجمه می‌کند، برنامه ترجمه‌های موجود و ذخیره‌شده را ارائه می‌کند.

بنابراین، یک ابزار CAT یا حافظه ترجمه، برخلاف برنامه‌های ترجمه ماشینی، به طور مستقل ترجمه نمی‌کند، بلکه تنها برای پشتیبانی از یک مترجم انسانی عمل کرده و ترجمه‌های ایجاد شده را در یک پایگاه‌داده ذخیره می‌کند. در واقع، مطالعات نشان داده‌اند که مترجمان هنگام استفاده از ابزارهای CAT تا ۲۸٪ سریع‌تر کار می‌کنند.

مزایای یک سیستم ترجمه به کمک کامپیوتر

بنابراین ابزارهای CAT امکان ترجمه‌های سریع‌تر و با کیفیت بالاتر را فراهم می‌آورند و همچنین ثبات آن ترجمه‌ها را تضمین می‌کنند. علاوه بر این، ابزارهای CAT می‌توانند طیف گسترده‌ای از قالب‌های فایل مانند فایل‌های مایکروسافت ورد، اکسل و پاورپوینت، فایل‌های اپن آفیس و حتی پرونده‌های XML را آماده و بخش‌بندی کنند.

این کار به مترجمان اجازه می‌دهد که حتی فایل‌‌های خاصی که نرم‌افزار ایجادکننده آن، مانند InDesign را هم ندارند، پردازش کنند.

امروزه، ابزارهای CAT برنامه‌های استاندارد صنعتی هستند که هم توسط شرکت‌های ترجمه و هم مترجمان در سراسر جهان مورد استفاده قرار می‌گیرند.

استفاده از یک ابزار CAT و حافظه ترجمه مرتبط، پایه و اساس ترجمه‌های آینده-که با هر ترجمه کامل رشد می‌کند-را می‌سازد. اگر یک فایل جدید با زبان مبدا در ابزار CAT باز شود و حافظه ترجمه مورد استفاده قرار گیرد، «کلمات جدید»، «۱۰۰٪ انطباق‌ها» (بخش‌های یک‌سان) یا «تطبیق‌های فازی» (بخش‌های مشابه) در هنگام ترجمه فایل نمایش داده می‌شوند. سپس این موارد توسط مترجم بررسی می‌شوند و در صورت لزوم، طوری تنظیم می‌شوند که بخش هدف بتواند ترجمه شود. در نتیجه لازم نیست که چرخ هر بار دوباره اختراع شود.

علاوه بر این، مزیت سیستم‌های حافظه ترجمه زمانی به وضوح آشکار می‌شود که نرخ‌های تکرار بالایی در یک سند وجود داشته باشد. بخش مربوطه تنها باید یک‌بار ترجمه شود و سپس می‌تواند به طور خودکار در تمام موارد دیگر متن توسط ابزار وارد شود. این امر مترجمان را کارآمدتر می‌سازد و می‌تواند هزینه‌ها را برای مشتریان کاهش دهد.

تحلیل متن

یک ابزار CAT هر متن جدید را با مقایسه آن با واحدهای ذخیره‌شده در حافظه ترجمه آن تحلیل می‌کند. سپس میزان محتوایی که باید ترجمه شود را ارزیابی می‌کند و این اطلاعات اغلب برای محاسبه هزینه‌ها استفاده می‌شود. یک تحلیل معمولا به این صورت تجزیه می‌شود:

  • کلمات جدید: بخش‌هایی که قبلا هرگز ترجمه نشده‌اند و در حافظه ترجمه وجود ندارند.
  • تطبیق‌های فازی: بخش‌هایی که شبیه به چیزی هستند که قبلا ترجمه شده‌اند و در حافظه ترجمه یافت می‌شوند اما باید توسط مترجم ویرایش شوند.
  • ۱۰۰٪ انطباق: بخش‌های مشابه که در حافظه ترجمه یافت می‌شوند
  • تطابق متن: یک بخش مشابه که دقیقا در همان زمینه (یعنی بین دو ۱۰۰٪ تطابق) مانند حافظه ترجمه ظاهر می‌شود.
  • تکرارها: بخش‌های مشابهی که در هر فایل بیش از یک‌بار رخ می‌دهند؛ مترجم تنها باید آن را یک‌بار ترجمه کند و این ابزار به طور خودکار بخش ترجمه‌شده را در سراسر سند تکرار می‌کند.

هر یک از انواع بخش‌ها نیازمند سطح متفاوتی از تلاش مترجم است؛ از یک ترجمه کاملا جدید از پایه تا بازبینی بدون هیچ تغییری.

هنگامی که یک مترجم برای اولین بار از ابزار CAT استفاده می‌کند و حافظه ترجمه آن‌ها هنوز خالی است، همه بخش‌ها به عنوان «کلمات جدید» باز خواهند گشت. اما به محض ذخیره شدن متن بیشتر، قدرت نفوذ شروع به افزایش خواهد کرد.

علاوه بر حافظه ترجمه، ابزارهای CAT ویژگی‌های دیگری نیز دارند از جمله:

  • مدیریت اصطلاحات
  • ویژگی‌های تضمین کیفیت
  • عملکرد جستجو و جایگزینی
  • جستجوهای فهرست‌ها
  • عملکرد هم‌تراز کردن متن

امروزه، ابزارهای CAT در نسخه‌های دسکتاپ و نسخه‌های مبتنی بر سرور یا مبتنی بر ابر در دسترس هستند. نسخه‌های مبتنی بر سرور معمولا توسط ارائه‌دهندگان خدمات زبانی بزرگ‌تر استفاده می‌شوند زیرا به مترجمان متعددی اجازه می‌دهند تا به طور همزمان بر روی یک پروژه کار کنند.

مهم است که ابزارهای CAT را با برنامه‌های ترجمه ماشینی اشتباه نگیریم.

ترجمه ماشینی چیست؟

یک برنامه ترجمه ماشینی برنامه‌ای است که یک متن را به یک الگوریتم کامپیوتری تبدیل می‌کند که به طور خودکار آن را به یک زبان دیگر ترجمه می‌کند. بنابراین هیچ انسانی درگیر فرآیند ترجمه نیست.

با این حال امروزه بسیاری از ابزارهای CAT یک افزونه ترجمه ماشینی ارائه می‌کنند. جالب توجه است که برخی از مترجمان بخاطر زمینه‌های اخلاقی یا به این دلیل که فکر می‌کنند این کار منجر به ترجمه ضعیف‌تری می‌شود و هنر را تضعیف می‌کند، از استفاده از آن‌ها خودداری می‌کنند.

ما سه نوع روش ترجمه ماشینی متمایز داریم:

۱) ترجمه ماشینی مبتنی بر قواعد: این روش بر قواعد زبان و دستور زبانی که توسط متخصصان زبان توسعه‌یافته و همچنین فرهنگ لغت‌های بسیار قابل سفارشی‌سازی متکی است.

۲) ترجمه ماشینی آماری: این روش بر قواعد زبانی و کلمات تکیه نمی‌کند؛ بلکه با تجزیه و تحلیل حجم زیادی از ترجمه‌های انسانی موجود یاد می‌گیرد.

۳) ترجمه ماشینی عصبی: این روش به خودش یاد می‌دهد چگونه با استفاده از یک شبکه عصبی بزرگ ترجمه کند؛ این روش روز به روز محبوب‌تر می‌شود چون نتایج بهتری نسبت به دو روش دیگر فراهم می‌کند. برای مثال، ترجمه ماشینی گوگل و مترجم مایکروسافت بر شبکه‌های عصبی متکی هستند.

برخی از برنامه‌های رایج ترجمه ماشینی عبارتند از:

امروزه بسیاری از ارائه‌دهندگان خدمات زبانی نوعی برنامه ترجمه ماشینی را به کار می‌گیرند و خروجی آن‌ها توسط مترجمان یا ویرایشگران انسانی، که به آن‌ها «پس-ویرایشگران» می‌گویند، بازبینی می‌شود تا نتایج،‌که اغلب ضعیف هستند، را بهبود بخشند.

طبیعتا، هزینه‌ها برای این برنامه‌های خودکار کم‌تر از ترجمه انسانی است، اما به همان نسبت همواره کیفیت پایین‌تری دارد. زبان بسیار پویا و پیچیده است و در حالی که فن‌آوری ترجمه ماشینی در طول سال‌ها تا حد زیادی بهبود یافته‌است، هرگز قادر نخواهد بود که تفاوت‌های ظریف هر زبان را به طور کامل شناسایی کند و آن‌ها را مانند مترجم انسانی به زبان دیگری منتقل کند.

بنابراین، مهم نیست که آن‌ها چقدر شبیه به هم هستند، ابزارهای CAT و برنامه‌های ترجمه ماشینی به طور متفاوت کار می‌کنند و برای اهداف مختلف مورد استفاده قرار می‌گیرند. به طور خلاصه، ابزارهای CAT توسط مترجمان حرفه‌ای استفاده می‌شوند و برای کاربران غیر حرفه‌ای مناسب نیستند. البته بازده انسانی محدود و پرهزینه است. اینجا جایی است که ترجمه ماشینی وارد می‌شود. برنامه‌های ترجمه ماشینی می‌توانند توسط هر کسی با هزینه کم و بدون هیچ هزینه‌ای استفاده شوند اما بسیار کم‌تر قابل‌اعتماد هستند. آن‌ها اغلب به همراه و در کنار بازبین‌های انسانی در شرکت‌های زبانی به کار گرفته می‌شوند.

اگر به خدمات ترجمه نیاز دارید، حالا می‌توانید گزینه‌های خود را بررسی کنید و تصمیم آگاهانه‌ای بگیرید که برای نیازهایتان مناسب است.


پی نوشت مترجم: در حوزه زبان فارسی - ابزار کمک‌مترجم ترجمیار به عنوان بهترین ابزار برای ترجمه مقالاتی علمی و تخصصی است که علاوه بر ارایه ترجمه ماشینی تخصصی با کیفیت خوب امکانات بسیار زیادی هم برای ساده‌کردن فرایند ترجمه در اختیار کاربر قرار می‌دهد. آزمایش این ابزار به دفعات رایگان بوده و هزینه ترجمه را تا یک بیستم کاهش می‌دهد.


این متن با استفاده از ربات ترجمه مقاله علمی ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.