مرکز تحقیقات هوش مصنوعی پارت
مرکز تحقیقات هوش مصنوعی پارت
خواندن ۶ دقیقه·۴ سال پیش

۵ روند و کاربرد سیستم‌های تشخیص صدا

آیا سیستم‌های تشخیص صدا به صورت اولیه را به خاطر دارید؟ سال‌ها پیش، اگر با تلفن‌تان شماره‌ای را می‌گرفتید از شما خواسته می‌شود که با صدای‌تان گزینه‌ای انتخاب کنید و این فرایند اغلب برای همه تجربه‌ای ناخوشایند به جا می‌گذاشت. برنامه‌های تشخیص صدای به اندازه کافی پیشرفته نبودند که بتوانند صدای همگی را تشخیص دهند. هرچند از آن زمان به بعد برنامه‌های تشخیص صدا پیشرفت‌های چشمگیری داشته‌اند. امروزه اگر با داروخانه تماس بگیرید تا نسخه‌تان را تجدید کنید و یا اگر با خط مستقیم کسب‌و‌کاری تماس بگیرید، به احتمال زیاد با استفاده از سیستم تشخیص صدای پشتیبانی مشتری می‌توانید با موفقیت کارتان را انجام دهید.

علاوه بر این استفاده از سیستم‌های تشخیص صدا دیگر به خطوط مستقیم پشتیبانی مشتری محدود نمی‌شود. از سیستم‌های تشخیص صدا در تلفن‌های هوشمند و رایانه‌ها و هم‌چنین صنایع گوناگون استفاده می‌شود. موارد استفاده از سیستم های تشخیص صدا بی‌نهایت است. در ادامه برترین روندها و موارد کاربرد فن‌آوری‌های تشخیص صدا را با یکدیگر بررسی می‌کنیم.

۱- پرداخت موبایلی با استفاده از سیستم های تشخیص صدا

آیا تا به حال به این فکر کرده‌اید که در آینده چگونه هزینه‌ها را پرداخت خواهید کرد؟ آیا تا به حال به این فکر کرده‌اید که در آینده ممکن است به جای پرداخت پول نقد و یا استفاده از کارت‌های اعتباری‌، از صدای‌‌تان برای پرداخت هزینه‌ها استفاده کنید؟ فرا رسیدن چنین روزی چندان دیر نیست. هم‌اکنون برخی شرکت‌ها در حال ساخت و ارتقای سیستم های تشخیص صدا برای انجام تراکنش‌ها هستند. استفاده از سیستم‌های تخشیص صدا برای انجام تراکنش‌ها آسان است و زمانی‌که با استفاده از تلفن‌های هوشمند و یا رایانه‌تان خریدهای‌تان را انجام می‌دهید، نیازی به استفاده از کیف پول نیست.

در ادامه شیوه انجام تراکنش‌ها با استفاده از سیستم تشخیص صدا را توضیح می‌دهیم: در حالت عادی پیش از انجام خرید‌های اینترنتی باید رمز و یا شماره شناسایی شخصیخود را تایپ کنید، اما فناوری تشخیص صدا این امکان را برای شما فراهم می‌کند تا رمزی یک بار مصرف را بگویید و خریدتان را انجام دهید. عملکرد سیستم‌های تشخیص صدا همچون کپچاها
 و سایر رمزهای یک‌ بار مصرف است که استفاده از آن‌ها در انجام تراکنش‌های اینترنتی مطمئن‌تر است –  با این تفاوت که در سیستم‌های تشخیص صدا رمز را باید با صدای بلند گفت. از آن‌جایی‌که سیستم‌های تشخیص صدا ماهیتی تصادفی دارند و به همین دلیل شما مصمئن هستید کسی نمی‌تواند رمز شما را بشنود و در نتیجه به اسم شما خریدی انجام دهد، استفاده از این سیستم‌ها بسیار بهتر از یک رمز همیشگی است. به زودی استفاده از سیستم های تشخیص صدا در پرداخت‌های موبایلی به امری رایج و متداول تبدیل می‌شود.

۲- دستیاران مجازی با قابلیت تشخیص صدای افراد

اکثر ما با سیری، اَلکساو سایر دستیاران مجازی هوش مصنوعی که در محیط کاری و یا در محیط خانه به ما در انجام کارهای روزانه کمک می‌کنند، آشنایی داریم. برای مثال کاربران در هنگام رانندگی با استفاده از دستیاران هوش مصنوعی مسیریابی کنند، چیزی را در اینترنت جست‌و‌جو کنند و یا آهنگی پخش کنند بدون آن‌که مجبور باشند دستگاه (موبایل و غیره) خود را در دست بگیرند و یا چراغ‌های‌ خانه‌شان را روشن کنند. به طور کلی دستیاران مجازی به صدایی که آن‌ها را فعال کرده است، پاسخ می‌دهند و شیوه پاسخ‌دهی آن‌ها به کاربران مختلف یکسان است.

با وجود این امروزه فناوری‌هایی مانند پردازش گفتار وجود دارد که این امکان را برای سیستم‌های هوش مصنوعی فراهم می‌کند تا هویت کاربر را تشخیص دهند. برای مثال با بهره‌گیری از این فن‌آوری می‌توان سیستم‌های هوش مصنوعی را برای صدای فرد خاصی فعال کرد. طی سال‌های اخیر این فناوری در گوشی‌های اَپل به‌کار رفته است. شما می‌توانید گوشی اَپل خود را به گونه‌ای تنظیم کنید تا سیری فقط کارهایی را انجام دهد یا به سؤالاتی پاسخ دهد که با صدای شما گفته می‌شوند. در صورتی‌که دستیار هوش مصنوعی شما فقط با صدای شما فعال شود، احتمال این‌که کاربر غیرمجازی از دستگاه، اطلاعات و متعلقات شما سوءاستفاده کند، کمتر است. دستیاران هوش مصنوعی به سادگی برای هر کاربر غیرمجازی فعال نمی‌شوند. به طور قطع در آینده‌ای نزدیک از این فناوری در حوزه‌های دیگر استفاده می‌شود.

۳- تشخیص صدا برای تأمین امنیت

بیشتر مردم چندین حساب‌ کاربری اینترنتی دارند و  امنیت آن‌ها باید تأمین شود و برخی از این حساب‌های اینترنتی همچون حساب‌های بانکی به لحاظ امنیتی ریسک بالایی دارند. در دورانی که بانک‌داری اینترنتی به شهرت بالایی دست پیدا کرده ضروری است سیستم‌های تشخیص هویتیمطمئن شوند که فقط صاحب حساب می‌تواند به اطلاعات حساس دسترسی پیدا کند. یکی از جدیدترین شیوه‌های احراز هویت کاربر ، احراز هویت از طرق تشخیص صدا است. همچون دستیاران هوش مصنوعی که صدای شما را تشخیص می‌دهند، عامل تشخیص گفتار نیز به مثابه یک «رمز» منحصر به‌فرد از صدای شما برای باز کردن حساب‌‌های رمزدار استفاده می‌‌کند. از آن‌جایی‌که صدای صاحب حساب با صدای سایر افراد تفاوت دارد امکان دسترسی به حساب برای سایرین وجود ندارد.

استفاده از تشخیص صدا برای باز کردن حساب‌های کاربری امنیت بیشتری دارد، چرا که می‌توان از سیستم‌های چند عاملیاستفاده کرد و بسیاری از ویژگی‌های امنیتی مختلف را با یکدیگر ترکیب کرد. برای مثال فرض کنید برای دسترسی به نرم‌افزاری کاربردی بانک‌داری‌تان باید اثرانگشت خود را اسکن کنید و رمزی را به صدای بلند بگویید. استفاده از صدای برای دسترسی به حساب‌های اینترنتی ایمن‌تر از رمزهای قدیمی است. علاوه بر این، سیستم‌هایی وجود دارند که در کنار فناوری تشخیص صدا از فناوری تشخیص چهره نیز استفاده می‌کنند.

۴- تشخیص صدا در جرم‌شناسی و شناسایی مجرمین

یکی دیگر از موارد کاربرد تشخیص صدا استفاده از این فن‌آوری در شناسایی مجرمین است. در اختیار داشتن یک فایل صوتی از مظنونین یک جرم می‌تواند مدرک مهمی باشد. در حال حاضر  AGNITIO و Morpho (Safran) با یکدیگر همکاری دارند و از فناوری احراز هویت از طریق صدادر صنعت جرم‌شناسی استفاده می‌کنند. به لطف وجود چنین محصولی، فناوری احراز هویت از طریق صدا ( در کنار اثرانگشت و سایر روش‌ها) می‌تواند در سراسر دنیا در جهت شناسایی و بررسی سوءپیشینه افراد مورد استفاده قرار بگیرد.

این فناوری می‌تواند در مدت زمان کوتاهی صداهای زنده و یا ضبط ‌‌شده را تطبیق دهد و نرخ دقت این فناوری در تشخیص صداها بسیار بالا و برابر با ۹۹ درصد است. علاوه بر این فناوری تشخیص صدا میان لهجه‌ها یا زبان‌های مختلف تمایز قائل نمی‌شود. فن‌آوری تشخیص صدا تُن صدای افراد را محاسبه می‌کند و این‌که فرد چه کلماتی به کار می‌برد و یا به چه زبانی صحبت می‌کند در تشخیص آن تغییری ایجاد نمی‌کند. از این روی، فناوری تشخیص صدا می‌تواند در سراسر دنیا در حل جرایم کاربرد داشته باشد.

۵- تشخیص صدا در نرم‌افزارهای کاربردی ترجمه

فرض کنید به یک کشور خارجی سفر کرده‌اید و می‌خواهید اتاقی در یک هتل رزرو کنید. کارمند پذیرش زبان انگلیسی را به سختی متوجه می‌شود و شما هم به سختی می‌توانید به زبان آن‌ها صحبت کنید و اطراف شما کسی نیست که بتواند صحبت‌های شما را برای یکدیگر ترجمه کند. اما شانس با شما است چرا که هتل یک سیستم ترجمه دارد که با استفاده از فن‌آوری تشخیص صدا جملات را به صوتر لحظه‌ای ترجمه می‌کند. شما می‌توانید جمله‌های‌تان را برای سیستم بگویید و سپس سیستم زبان شما را پردازش می‌کند و آن را به صورت صوتی و یا بصری ترجمه می‌کند، در نتیجه کارمند پذیرش متوجه صحبت‌های شما می‌شود.

علاوه بر کمک به مسافرانی که به کشورهای خارجی سفر می‌کنند، از این فناوری می‌توان در تجارت‌ها، مدارس و سایر سازمان‌های بین‌الملل بهره گرفت. با استفاده از این فناوری به سادگی می‌توان با کسی که به زبان شما صحبت نمی‌کند گفت‌وگو کنید و می‌تواند تأثیر شگرفی در رفع موانع زبانی داشته باشد.

ما فهرستی از شرکت‌های فعال در حوزه پردازش گفتار را گردآوری کرده‌ایم تا در اختیار علاقه‌مندان و مخاطبان این حوزه قرار دهیم تا بتوانند اطلاعات کاملی در مورد هر کدام از این شرکت‌ها کسب نموده و نیازهای آن‌ها در این زمینه به خوبی مرتفع گردد.

منبع: hooshio.com

پردازش گفتارچت باتهوش مصنوعی
هوشمندسازی فرآیندهای زندگی https://partdp.ai/
شاید از این پست‌ها خوشتان بیاید