آشنایی با توسعه دستیار هوشمند مکالمه‌ای با استفاده از پلتفرم رسا - قسمت اول

مقدمه

مطابق گزارش‌های معتبر در خصوص فناوری‌های در حال ظهور و آینده‌دار (Trending Techs)، دستیارهای مبتنی بر هوش مصنوعی و چت‌بات‌ها از فناوری‌های کلیدی در حال ظهور هستند که بازار آن‌ها در سال‌های گذشته رشد چشمگیری را تجربه کرده است.

مطابق «آمار چت‌بات‌ها: ۲۰۲۰ و فراتر»، که Andy Peart در لینکدین منتشر کرده است، گردش مالی هوش مصنوعی مکالمه‌ای رشد شایان توجهی را از سر می‌گذراند.

مطلب منتشرشدۀ Andy Peart اشاره می‌کند که مطابق گزارش Markets and Markets، انتظار می‌رود که اندازۀ بازار جهانی هوش مصنوعی مکالمه‌ای از ۴.۲ میلیارد دلار آمریکا در سال ۲۰۱۹ میلادی تا ۱۵.۷ میلیارد دلار آمریکا در سال ۲۰۲۴ میلادی رشد کند، همچنین نرخ رشد مرکب سالیانۀ مورد انتظار برای آن ۳۰.۲ درصد است.

دستیارهای مجازی هوشمند و چت‌بات‌ها دو دستۀ اصلی موجود در گزارش بازار هوش مصنوعی مکالمه‌ای هستند.

نکتۀ درخور توجه این است که دستۀ چت‌بات‌ها بازار بزرگ‌تری را در طول بازۀ پیش‌بینی به خود اختصاص می‌دهد. آمارهای Research and States نشان می‌دهد که بازار چت‌بات‌ها در سال ۲۰۱۸ میلادی ۱.۲ میلیارد دلار ارزش داشته است، درحالی‌که انتظار می‌رود ارزش این بازار در سال ۲۰۲۴ میلادی به ۷.۵ میلیارد دلار برسد و در طول این مدت، رشد مرکب سالیانۀ ۳۴.۷۵ درصد را ثبت کند.

عوامل عمده‌ای که موجب رشد بازار چت‌بات‌ها شده است شامل تقاضای فزاینده برای خدمات پشتیبانی مشتریان مبتنی بر هوش مصنوعی، استقرار اُمنی‌ـ‌چنل و هزینه‌های کاهش‌یافتۀ توسعۀ چت‌بات‌ها می‌شود.

گزارش‌های متعدد از منابع مختلف نشان می‌دهد که استفاده از چت‌بات‌ها در صنایع مختلفی نظیر بانکداری، بیمه، خرده‌فروشی و حتی در کارهای اداری کارمندان یقه‌سفید رو به رشد بوده و موجب صرفه‌جویی‌های درخور توجهی شده است. در مجموع، داده‌های متعدد از منابع مختلف نشان می‌دهد که استفاده از چت‌بات‌ها و تعامل با آن‌ها رو به رشد است؛

بااین‌حال، انتخاب پلتفرم توسعۀ مناسب برای ساخت چت‌بات‌ها تصمیمی کلیدی است.

مطابق گزارش گارتنر، شانزده شرکت از بین شرکت‌هایی که در زمینۀ توسعۀ دستیارهای هوشمند یا زیرساخت توسعۀ آن‌ها فعالیت می‌کنند شاخص‌تر هستند. یکی از این شرکت‌ها Rasa است که مطابق گزارش CBInsights2021 در بین برترین استارتاپ‌های حوزۀ هوش مصنوعی در سال ۲۰۲۱ در زمینۀ پردازش زبان طبیعی و هوش مصنوعی مکالمه‌ای قرار دارد.

در این مجموعه مطالب، به معرفی پلتفرم رسا و بررسی مفاهیم اساسی توسعۀ دستیار هوش مصنوعی مکالمه‌ای/ دستیارهای زمینه‌ای با استفاده از این پلتفرم می‌پردازیم. در واقع این مجموعه مطالب برداشتی از ویدئوهای آموزشی رساست که هدف آن معرفی این پلتفرم، برخی مفاهیم استفاده‌شده در رسا و همچنین اشاره به برخی جنبه‌های عملی توسعه با پلتفرم رساست. درعین‌حال، اگر به توسعۀ دستیار شخصی هوشمند بر بستر پلتفرم رسا مایل باشید، خواندن این مطالب شما را از مراجعه به مطالب آموزشی رسا بی‌نیاز نمی‌کند و توصیه می‌شود که برای توسعۀ چت‌بات به ویدئوهای آموزشی رسا در یوتیوب یا به کتابچۀ راهنمای جامع این شرکت مراجعه کنید.

همان‌طور که در شکل ۱ مشاهده می‌شود، عالی‌ترین سطح توسعۀ دستیارهای هوش مصنوعی مکالمه‌ای در حال حاضر دستیارهای زمینه‌ای است.

شکل ۱: سیر تحول هوش مصنوعی مکالمه‌ای در گذر زمان.
شکل ۱: سیر تحول هوش مصنوعی مکالمه‌ای در گذر زمان.


مطابق آنچه در آموزش‌های رسا آمده، در حال حاضر هنوز هم، استاندارد غالب صنعت برای توسعۀ چت‌بات‌ها استفاده از FAQهاست (سطح ۲) که برای توسعۀ این چت‌بات‌ها از مجموعه‌ای از قوانین یا از ماشین وضعیت استفاده می‌شود. نکتۀ مثبت این رویکردها ساده کردن ساخت دستیارهاست، اما ازطرفی هم استفاده از این رویکردها برای ساخت چت‌بات‌ها بسیار مستعد خطاست.

دستیارهای زمینه‌ای سعی می‌کنند عملکرد دستیار را به مکالمۀ طبیعی انسان‌ها شبیه‌تر کنند، یعنی همان‌طور که در مکالمه‌های انسان‌ها، زمینه بسیار حائز اهمیت است، این دستیارها هم، با توجه کردن به زمینه، مکالمه را پیش می‌برند، اگر به‌صورت غیرمنتظره، مسیر مکالمه تغییر کند، آن را درک می‌کنند و به‌طور متناسب به آن پاسخ می‌دهند.

منظور از زمینه این است که توجه کنیم کاربر قبلاً چه چیزی گفته، چه زمانی آن را گفته، کجا و چطور گفته و... و از این اطلاعات برای مدیریت و پیشبرد مکالمه استفاده کنیم.

اجزای پلتفرم رسا برای توسعۀ دستیارهای زمینه‌ای

رسا مجموعه‌ای از ابزارهای یادگیری ماشین منبع‌باز است که به توسعه‌دهندگان امکان می‌دهد تا دستیارهای هوش مصنوعی زمینه‌ای را (متنی یا صوتی) توسعه دهند. پلتفرم رسا، برای ممکن کردن توسعۀ دستیارهای زمینه‌ای، رویکرد مبتنی بر یادگیری ماشین را جایگزین رویکردهای مبتنی بر قوانین یا ماشین‌های حالت کرده است.

پلتفرم رسا با استفاده از ۳ (۲ + ۱) مؤلفۀ اساسی این قابلیت را در اختیار توسعه‌دهندگان قرار می‌دهد:

  • NLU: نوعی ابزار پردازش زبان طبیعی منبع‌باز برای طبقه‌بندی اینتنت و استخراج انتیتی.

این مؤلفه، به تعبیری، گوش سیستم شماست که کمک می‌کند دستیار شما متوجه شود چه چیزی گفته شده است.

این مؤلفه ورودی کاربر را در قالب غیرساخت‌یافتۀ زبان انسان دریافت می‌کند و داده‌های ساخت‌یافته را در قالب اینتنت و انتیتی از آن استخراج می‌کند. اینتنت را می‌توان برچسب‌هایی در نظر گرفت که باتوجه‌به هدف کلی کاربر از پیامش، به هر ورودی کاربر نسبت داده می‌شود. انتیتی‌ها مجموعه اطلاعاتی هستند که دستیار ممکن است در هر زمینۀ خاص به آن نیاز داشته باشد.

نمونه‌ای از استخراج اینتنت و انتیتی از مکالمۀ کاربر در شکل ۲ نشان داده شده است.

شکل ۲: نمونۀ شناسایی اینتنت و استخراج انتیتی از مکالمۀ کاربر.نۀ شناسایی اینتنت و استخراج انتیتی از مکالمۀ کاربر.
شکل ۲: نمونۀ شناسایی اینتنت و استخراج انتیتی از مکالمۀ کاربر.نۀ شناسایی اینتنت و استخراج انتیتی از مکالمۀ کاربر.


دستیار باید My name را از ورودی استخراج کند و آن را در طول مکالمه به خاطر بسپارد تا تعامل را طبیعی نگاه دارد. این کار از طریق تعلیم یک مدل NER به‌منظور شناسایی و استخراج انتیتی‌ها از پیام‌های غیرساخت‌یافتۀ کاربران انجام می‌شود.

  • Core یا Dialogue Management: چارچوبی برای تصمیم‌گیری زمینه‌ای بر اساس یادگیری ماشین.

وظیفۀ این مؤلفه در رسا مدیریت دیالوگ‌های کاربران است.

این مؤلفه، به تعبیری، مغز سیستم شماست و بر اساس وضعیت (state)، به‌خصوص مکالمه و زمینه، پیش‌بینی می‌کند که چه پاسخی باید به کاربر داده شود.

نمونۀ پیش‌بینی ماژول مدیریت دیالوگ از پاسخی که دستیار باید ارائه کند در شکل ۳ نشان داده شده است.

شکل ۳: نمونۀ پیش‌بینی پاسخ (اقدام بعدی) دستیار بر اساس ورودی کاربر و زمینۀ مکالمه.
شکل ۳: نمونۀ پیش‌بینی پاسخ (اقدام بعدی) دستیار بر اساس ورودی کاربر و زمینۀ مکالمه.


مؤلفۀ Core این‌ها را از طریق مشاهدۀ الگوهایی از داده‌های مکالمه‌ای نمونه، که بین کاربر و دستیار انجام شده است و به آن‌ها story هم گفته می‌شود، یاد می‌گیرد.

سؤالی که ممکن است ذهن شما را درگیر کرده باشد این است که مؤلفۀ Core، زمینۀ (context) را چطور حفظ می‌کند؟

به‌طور خلاصه، مدل یادگیری ماشین نگاه می‌کند که مکالمه در حال حاضر دربارۀ چیست و همچنین به عقب نگاه می‌کند تا ببیند که پیش‌تر چه‌چیزی گفته شده است. علاوه بر این، ماژول مدیریت دیالوگ، جزئیات دیگری را نیز در نظر می‌گیرد. برای مثال، اطلاعاتی که مؤلفۀ NLU استخراج کرده است (چراکه برخی انتیتی‌‌ها که بعدتر از آن‌ها به‌عنوان slot استفاده می‌شود ممکن است روی چگونگی پیش‌بینی اقدام بعدی سیستم Dialogue Management به‌طور مستقیم تأثیر داشته باشند).

  • Rasa X

مؤلفۀ Rasa X این قابلیت را ایجاد می‌کند که دستیار از مکالمه‌های جدید یاد بگیرد و در طول زمان عملکرد آن بهبود پیدا کند.

عملکردهایی که Rasa X انجام می‌دهد تا دستیار در طول زمان بهبود پیدا کند در شکل ۴ نشان داده شده است.

شکل ۴: عملکردهای Rasa X که بهبود دستیار در طول زمان را ممکن می‌کند.
شکل ۴: عملکردهای Rasa X که بهبود دستیار در طول زمان را ممکن می‌کند.


نحوۀ عملکرد انتها تا انتهای رسا در تعامل با کاربر و با استفاده از مؤلفه‌های سه‌گانه در شکل ۵ نشان داده شده است.

شکل ۵: نحوۀ عملکرد انتها تا انتهای رسا در تعامل با کاربر و با استفاده از مؤلفه‌های سه‌گانۀ رسا.
شکل ۵: نحوۀ عملکرد انتها تا انتهای رسا در تعامل با کاربر و با استفاده از مؤلفه‌های سه‌گانۀ رسا.


در مطالب بعدی به معرفی بیشتر اجزای NLU و Core و چگونگی عملکرد آن‌ها می‌پردازیم.

منابع

  1. Peart, A. (2020, May 19). Chatbot Statistics: 2020 & Beyond. Linkedin. https://www.linkedin.com/pulse/chatbot-statistics-2020-beyond-andy-peart/, Last accessed July 2021.
  2. Meese M. (2021, April 8). CB Insights reveals 2021 cohort of 100 most-promising AI companies. TechRepublic. https://www.techrepublic.com/article/cb-insights-reveals-2021-cohort-of-100-most-promising-ai-companies/, Last accessed July 2021.
  3. Revang, M., Baker, V., Manusama, B., Mullen, A., and Lee, A. Market Guide for Conversational Platforms. Gartner. https://www.gartner.com/en/documents/3953723/market-guide-for-conversational-platforms, Last accessed July 2021.
  4. Rasa. (2019, October). Rasa Masterclass: Developing Contextual AI assistants with Rasa tools. https://www.youtube.com/playlist?app=desktop&list=PL75e0qA87dlHQny7z43NduZHPo6qd-cRc, Last accessed July 2021.
  5. The Rasa Masterclass Handbook. 2019. The Rasa Masterclass Handbook; A Companion Guide to the Rasa Masterclass Video Series. Rasa Publication, 2019, https://cdn2.hubspot.net/hubfs/6711345/ebook-v3.pdf?__hstc=&__hssc=&hsCtaTracking=2cf912f3-4137-4338-829e-08bb4713f0f6%7Cda22eae5-512d-48fe-b46a-c74517f3d870.