« شرکت دانشبنیان عامراندیش هوشمند » _ هوشمندسازی کسب و کارها و ارتقای توانمندی آنها در محیط رقابتی مبتنی بر هوش مصنوعی
چرا گفتار به نوشتار گوگل؟ مقایسه تایپ صوتی گوگل و محصول ایرانی تبدیل گفتار به نوشتار
در مقالهی تایپ صوتی گوگل در مورد مزایا و معایب استفاده از تبدیل گفتار به نوشتار گوگل صحبت کردهایم. در این مقاله قصد داریم تا مشخصههای تبدیل گفتار به نوشتار گوگل و محصول فارس آوا شرکت عامر اندیش را با یکدیگر مقایسه کنیم.
تبدیل گفتار به نوشتار فارسی گوگل
تبدیل گفتار به نوشتار گوگل همان تایپ صوتی گوگل است که به صورت رایگان در سرویسهایی همچون Google Docs، Google Slides و… در اختیار کاربران قرار دارد. بسیاری از نرمافزارهایی که برای تایپ از آن استفاده میشود نیز قابلیت برخورداری از سرویس تبدیل گفتار به متن گوگل را دارد. تایپ صوتی گوگل بر روی کیبورد اکثر گوشیهای هوشمند در دسترس میباشد و همان نشانگر میکروفونی است که در کنار دکمهی فاصله کیبرد قرار گرفته است. در رایانههای شخصی نیز به صورت رایگان میتوان و از طریق سرویس Google Doc از گفتار به نوشتار گوگل کمک گرفت.
سرویس تبدیل گفتار به متن گوگل در نسخه جدید خود از 119 زبان زنده دنیا پشتیبانی میکند که زبان فارسی نیز یکی از آنها میباشد. تبدیل گفتار به متن گوگل قادر است گفتار عام در زبان فارسی را تشخیص داده و آن را به متن تبدیل نماید. هماکنون این سرویس به صورت رایگان بر روی پلتفرمهایی که در بالا به آنها اشاره شد در دسترس کاربران فارسی زبان میباشد.
تبدیل گفتار به نوشتار فارس آوا محصول عامر اندیش
فارس آوا، نرم افزار تبدیل گفتار به متن در زبان فارسی است که امکان ارتباط کلامی انسان با کامپیوتر و یا موبایل را فراهم می کند. این نرم افزار با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهره گیری از آخرین تکنولوژیهای روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاست موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهره مندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکت های بزرگی چون گوگل دارای ضریب دقت بالایی باشد.
علاوه بر آن فارس آوا دارای دو محصول جانبی میباشد که تبدیل متن به گفتار یا Text to Speech و استخراج کلمات کلیدی یا Keyword Spotting را انجام میدهند. همانطور که در ابتدای مقاله گفتیم، قبلا در مورد معایب و مزایای تایپ صوتی گوگل صحبت کردهایم. در این مقاله قصد داریم محصول فارس آوا شرکت عامر اندیش را با تایپ صوتی گوگل مقایسه کنیم و ببینیم در چه بخشهایی محصول فارس آوا میتواند از آن پیشی بگیرد.
مقایسه گفتار به نوشتار گوگل و فارس آوا در زبان فارسی
در بسیاری لحاظ محصول فارس آوا و تایپ صوتی گوگل دارای شباهتهایی میباشند. اما این دو محصول دارای یکسری تفاوتهای قابل توجهی هستند. این تفاوتها ناشی از متمرکز بودن محصول فارس آوا بر روی زبان فارسی است و اینکه تبدیل گفتار به متن گوگل بر روی گفتار عام زبان فارسی نمرکز دارد و نه لغات تخصصی و مخصوص به این زبان.
تشخیص لهجه و گویش
زبان فارسی پر است از گویشها و لهجههای متفاوت. برای آنکه یک نرمافزار تبدیل گفتار به نوشتار بتواند به خوبی در زبان فارسی کار کند، باید بتواند تمام این گویشها و لهجهها را تشخیص دهد. متاسفانه سرویس تبدیل گفتار به نوشتار گوگل تنها میتواند گفتار عام در زبان فارسی را به خوبی متوجه شود و لهجهها و گویشهای مختلف زبان فارسی به آن آموزش داده نشده است. لذا برای کسانی که میخواهند یک سرویس داخلی با قالبلیت تبدیل گفتار به نوشتار فارسی ارائه نمایند، نمیتوانند به طور کامل بر سرویس گوگل اتکا کننند.
از سوی دیگر، محصول فارس آوا قابلیت آن را دارد که گویش و لهجههای مختلف را در زبان فارسی تشخیص دهد و آنها را تبدیل به متن نماید. از آنجایی که این محصول بر روی زبان فارسی متمرکز شده است تمام این لهجهها به آن آموزش داده شده است و کسانی که میخواهند از این محصول استفاده کنند دیگر لازم نیست نگران تشخیص گفتار در گویش و لهجههای متفاوت باشند.
تشخیص گفتار رسمی و محاورهای
همانند تشخیص لهجه و گویشهای مختلف در زبان فارسی، محصول فارسآوا میتواند گفتار رسمی در زبان فارسی را از گفتار محاورهای تشخیص دهد. همه میدانیم که در زبان فارسی تفاوت بین گفتار محاوره و گفتار رسمی بسیار زیاد است و سرویس تبدیل گفتار به متن کاربردی باید بتواند این دو را از یکدیگر تمیز دهد. متاسفانه سرویس گوگل دارای چنین قابلیتی نمیباشد.
دسترسی API
درست است که سرویس گوگل بر روی پلتفرمهایی که از آن یاد شد به صورت رایگان در دسترس عموم میباشد، اما کسبوکارهای پلتفرمی که برای مجهز کردن خود به سرویس تبدیل گفتار به نوشتار میخواهند از گوگل API دریافت کنند باید ماهیانه مبلغی را به دلار بپردازند. پر واضح است که پرداخت مبلغ به دلار برای کسبوکارهای ایرانی هزینهی گزافی به همراه دارد. در مقابل این کسبوکارها میتوانند از محصول فارسآوا استفاده کنند.
سفارشی سازی تبدیل گفتار به نوشتار
یکی دیگر از نکات مهمی که در تبدیل گفتار به متن گوگل وجود ندارد و قابلیت سفارشی سازی برای کسبوکارهای مختلف است. برخی از کسبوکارها همانند وکالت دارای اصطلاحات تخصصی در زبان فارسی هستند که این کلمات تخصصی به سرویس تایپ صوتی گوگل آموزش داده نشده است. در مقابل محصول فارسآوا دارای چنین قابلیتی میباشد و میتواند برای کسبوکارهای مختلف سفارشی سازی شود.
قابلیت پردازش فایلهای صوتی از پیش ضبط شده
یکی از قابلیتهای خوب محصول فارسآوا که سرویس تبدیل گفتار به متن گوگل از آن محروم است، قابلیت پردازش فایلهای صوتی از پیش ضبط شده میباشد. شما میتوانید فایلهای صوتی با فرمتهای مختلف را به محصول فارسآوا بدهید و در مقابل متن این فایلها را دریافت نمایید.
قابلیت تبدیل گفتار به نوشتار به صورت آفلاین
محصول فارسآوا دارای اپلیکیشن اندرویدی و نسخه دسکتاپ نیز میباشد که کاربران مختلف میتوانند بدون نیاز به اتصال به اینترنت و به صورت آفلاین گفتار خود را به نوشتار تبدیل کنند. نسخه دسکتاپ و اپلیکیشن محصول فارسآوا بصورت رایگان در دسترس عموم میباشد و کاربران میتوانند از آن استفاده نمایند. در مقابل سرویس گوگل دارای چنین قابلیتی نمیباشد و برای استفاده از آن شما باید در تمام مدت به اینترنت متصل باشید.
مطلبی دیگر از این انتشارات
هر آنچه لازم است از ربات سوفیا بدانید! هوش مصنوعی که احساس دارد
مطلبی دیگر از این انتشارات
نمونه کاربردهای هوش مصنوعی در حوزه های مختلف
مطلبی دیگر از این انتشارات
کاربرد های پردازش تصویر در کسب و کار ها