تقویت هوش مصنوعی گفتار به متن، با سرعت در تجارتها تکرار می شود.
کمک به محتوای با کیفیت برای رسیدن به بازار جهانی از نظر زبانی متنوع چالشی است که Vitra.ai تصمیم گرفت با استفاده از هوش مصنوعی آن را حل کند.
یکی از بنیانگذاران Satvik Jagannath مشاهده کرد که کسب و کارها اغلب محتوای عالی دارند - ویدئوها، تصاویر، پادکست ها و متن - اما چیزی که آنها نیاز داشتند دسترسی بیشتر بود، راهی برای ورود به بازارهای جهانی، گسترش حضور و افزایش درآمد با استفاده از محتوایی که قبلا داشتند. ، به جای اختراع مجدد چرخ.
ساتویک جاگانات، یکی از بنیانگذاران Vitra.ai بیان دارد:
همکاری با Azure Cognitive Services به Vitra.ai اجازه داده است که در بازاری پرشتاب به رشد و سود خود ادامه دهد و تقاضای رو به رشد برای دسترسی جهانی را با ترجمه با یک کلیک برای وسیع ترین محدوده ممکن از محتوا برآورده کند.
همانطور که ساتویک توضیح میدهد، امروزه همه محتوایی در سطح جهانی تولید میکنند، اما جایی که همه با مشکل مواجه میشوند، دسترسی به محتوا است. پس از سه سال تحقیق، به این نتیجه رسیدم که زبان مانع است.
ایده این بود که از پردازش زبان طبیعی (NLP) برای حذف این موانع با ترجمه سریع و حساس به متن استفاده شود. تیم او در ابتدا یک پشته فناوری را بر اساس ترکیبی از اجزای DIY انتخاب کرد که بیشترین درجه کنترل دانه ای را فراهم می کرد.
اما پس از موفقیت های اولیه، راه حل هوش مصنوعی Vitra.ai با مشکلاتی مواجه شد. مقیاس دهی راه حل آنها سخت تر از آن چیزی بود که پیش بینی می کردند، تا زمانی که آنها راه جدیدی برای تغییر وضعیت سخت و بهره مندی از مزایای کامل هوش مصنوعی و در عین حال صرفه جویی 22 درصدی در هزینه ها کشف کردند.
مدل اولیه موفق Vitra.ai نرخ رضایت بسیار بالایی را در بین مشتریان اولیه به دست آورد. پلتفرم این شرکت که ترجمه مبتنی بر هوش مصنوعی را 100 برابر سریعتر از راه حل های قدیمی تر ارائه می دهد، در هزینه ها صرفه جویی می کند و با آموزش در طول زمان پیشرفت های بیشتری را ارائه می دهد.
اما زمانی که زمان آن فرا رسید که راه حل خود را برای پاسخگویی به تقاضا مقیاس کنند، تیم Vitra.ai متوجه شد که هزینه عملیاتی زیادی برای مدیریت چندین API سفارشی و زیرساخت پیچیده راه حل آنها وجود دارد.
در ابتدا Vitra.ai مدلهای سفارشی داخلی را بر روی معماری چند ابری اجرا میکرد. ساتویک اذعان میکند که حتی از همان ابتدا، این کار زمانبر و هزینهبر بود و آموزش مدلها تا جایی که میتوانستند دقت بالایی در ترجمه ارائه کنند، سه تا شش ماه طول میکشید.
اما هنگامی که سکو شروع به بلند شدن کرد، آنها با مشکل مواجه شدند. همانطور که Vitra.ai مشتریان خود را به دست آورد و تقاضا افزایش یافت، آنها به سختی میتوانستند سیستم خود را راهاندازی کنند و برای هماهنگی با نیازهای مشتریان خود مقیاسپذیری کنند.
از یک نظر، کسب و کار در حال رونق بود: مدل ها کار می کردند و مشتریان از مزایای آن بهره می بردند. اما حجم کاری تیمهای ساتویک غیرقابل مدیریت بود و به حاشیههای آنها میرسید.
ساتویک می گوید: «ما نتوانستیم این مدل ها را مدیریت کنیم. پیچیدگی زیرساخت ها در حال افزایش بود. ما مجبور بودیم خدمات زیادی را در مکانهای مختلف مدیریت کنیم که باعث تأخیر شبکه و کابوسهای رفع اشکال میشد.»
قبل از اینکه این مشکلات بر تجربه مشتری آنها تأثیر بگذارد، Vitra.ai نیاز به تغییر سریع داشت.
کلمه DIY مخفف Do it yourself به معنای خودت انجام بده و اصطلاحاً به معنای تعمیر، اصلاح، ساختن و یا انجام برخی کارهای فنی در خانه یا بیرون از خانه بدون کمک خواستن از متخصصان و استادکاران آن رشته است.
ساتویک اذعان دارد که با نگاهی به گذشته، اگرچه توسعه داخلی ممکن است برای استارتآپها جذاب باشد، اما همیشه کارآمدترین راهحل نیست.
امروزه ما میتوانیم با سرورهای ابری شرکت ابر فردوسی در تمام جهان کارهای خود را تسهیل کنیم.
پلتفرم Vitra.ai در ابتدا بر اساس معماری چند ابری توسعه یافته داخلی، با خدماتی مانند GPU، CPU/compute، هوش مصنوعی کاربردی، خدمات متنی و غیره از ارائه دهندگان مختلف ابری ساخته شد. با این حال، استفاده از چندین ارائه دهنده در مقیاس دست و پا گیر بود که منجر به گلوگاه ها و مشکلات ردیابی و اشکال زدایی شد.
ساتویک می گوید: «مدیریت این سیستم در حال غیرممکن شدن بود. ناگهان مشتری داشتید که می خواست از صدها ساعت استفاده کند. آنها خروجی را در یک بازه زمانی سه ساعته میخواستند، و شما باید دریابید که چگونه برای این مدت زمان مقیاسبندی کنید.»
معماری پیچیده و توزیع شده پلتفرم، مبتنی بر نمونههای GPU و CPU، که همگی با استفاده 100 درصدی اجرا میشوند، رویکرد متعادلکننده بار را ناکارآمد کرده است. اگرچه مقیاس خودکار کمک کرد، اما هزینه ها هنوز کنترل نشده بود. Vitra.ai اغلب مواردی را که بیش از حد تهیه میکرد، صرفاً برای پاسخگویی به خوشهها و کاهش بیشتر به حاشیهها، به پایان میرساند.
آنها شروع به جستجوی اطراف برای یافتن راه حل بهتری کردند که به آنها امکان می دهد هوش مصنوعی درجه یک سازمانی را ارائه دهند و در عین حال در هزینه ها صرفه جویی کنند. آنها دریافتند که خدمات هوش مصنوعی کاربردی راه حل های آماده تبدیل متن به گفتار با استفاده از هوش مصنوعی و NLP را ارائه می دهد که می تواند بهترین راه برای پیشرفت Vitra.ai باشد.
اهداف Vitra.ai در بازسازی پلتفرم خود کاهش تأخیر برای تجربه بهتر مشتری، آسانتر کردن اشکالزدایی و صرفهجویی در هزینههای ابری بود. دستیابی به همه اینها بدون تأثیر بر میزان دقت گفتار به نوشتار پلتفرم ضروری بود.
شرکت Vitra.ai که به دنبال راه حلی به اطراف بود، آزمایشی را با طیف وسیعی از APIها برای چندین سیستم پیشرو گفتار به متن، از جمله تست A/B اجرا کرد. این فرآیند دقیق به آنها داده های زیادی برای مقایسه عملکرد پلتفرم های مختلف داد.
نتایج مبتنی بر دادهها و نمودارها بسیار هیجانانگیز بودند و دستاوردهای عمدهای را در عملکرد مدل ارائه کردند. در این اثبات اولیه مفهوم، خدمات شناختی Azure میزان دقت کلی 80٪ را با 30٪ بهبود در دقت نقطه گذاری نسبت به مدل های سفارشی Vitra.ai ارائه کرد.
استاویک می گوید که رفتن به Azure Cognitive Services یک تصمیم آسان بود. ساتویک می گوید: این فقط یک عامل نبود که به ما در این تصمیم کمک کرد. صدها متخصص و مشاور فنی داخلی، سرعت، دقت ترجمه و هزینه کلی راه حل ها را قبل از تصمیم گیری ارزیابی کردند.
ادغام پلتفرم آنها با Azure Cognitive Services شامل یک ادغام API ساده است، که Satvik می گوید در مقایسه با ماه ها یا حتی سال ها زمان توسعه داخلی سفارشی، تقریباً نیم ساعت طول کشید.
ساتویک میگوید: وقتی به عنوان یک استارتآپ شروع به کار میکنید، میخواهید همه کارها را انجام دهید. «سپس متوجه میشوید که تخلیه کردن همه چیزهایی که نمیخواهید در مقیاس انجام دهید، در واقع نتایجی را به همراه خواهد داشت.»
نتایجی مانند صرفه جویی در هزینه ها، کاهش تأخیر و بهبود گسترده مقیاس پذیری.
شکل زیر معماری گفتار به متن Vitra.ai، ترکیبی از خدمات شناختی Azure و مدل های سفارشی را نشان میدهد.

استاویک می گوید: «استفاده از خدمات شناختی Azure ما را نجات داد. ما مجبور نبودیم چیزی تهیه کنیم. این یک مدل پرداخت به اندازه شما بود. ما فقط زمانی که از این سرویس استفاده کردیم پرداخت کردیم و تقریباً 2.5 برابر مقرون به صرفه تر از اجرای زیرساخت های خودمان بود.
امروزه Vitra.ai از ترکیبی از مدلهای پردازش زبان طبیعی سفارشی (NLP) خود در کنار خدمات گفتار شناختی Azure برای هوش مصنوعی استفاده میکند. ساتویک میگوید: «حتی اگر میخواهید چیزی سفارشی بسازید، میتوانید دادههای خود را بیاورید و بر روی مدلهای موجود Azure تمرین کنید.»
خدمات شناختی Azure به پاسخگویی به "چه" و "چه کسی" گفتار کمک می کند، در حالی که خدمات NLP سفارشی Vitra.ai به "چرا" و "چگونه" پاسخ می دهد و پازل پیچیده تشخیص و ترجمه گفتار را تکمیل می کند.
با راهحل جدید و کارآمد Vitra.ai، فوایدی به همراه داشت:
افزایش امتیاز CSAT 23٪
پردازش زبان بهتر، از جمله 30٪ بهبود قرار دادن علائم نگارشی
صرفه جویی فوری در هزینه، کاهش هزینه های کلی تا 22٪
استفاده از APIها برای هوش مصنوعی به Vitra.ai اجازه میدهد تا هزینههای عملیاتی را همراه با تحقیق و توسعه داخلی کاهش دهد و به آنها این امکان را میدهد تا پولی را که پسانداز میکنند به سمت نوآوری پلتفرم هدایت کنند، ویژگیها را ایجاد و اصلاح کنند تا نیازهای مشتریان را بهتر برآورده کنند.
هوش مصنوعی کاربردی طیف وسیعی از مزایا را برای کسبوکارها در هر اندازه ارائه میکند، بهویژه برای استارتآپهایی که کاربرد بسیار خوبی برای هوش مصنوعی دارند، اما در مهندسی دادههای تخصصی با تأخیر مواجه میشوند یا زمانی که نیاز به مقیاسبندی راهحل خود دارند، دردسرهای فزایندهای را تجربه میکنند.
اساتویک میگوید: بهعنوان یک استارتآپ، باید سریع شروع کنید، سریع به بازار بروید. "همکاری با Azure Cognitive Services به Vitra.ai اجازه داده است که در بازاری پرشتاب به رشد و سود خود ادامه دهد و تقاضای رو به رشد برای دسترسی جهانی را با ترجمه یک کلیک برای وسیع ترین محدوده ممکن از محتوا برآورده کند."