آشنایی با توسعه دستیار هوشمند مکالمهای با استفاده از پلتفرم رسا - قسمت اول
مقدمه
مطابق گزارشهای معتبر در خصوص فناوریهای در حال ظهور و آیندهدار (Trending Techs)، دستیارهای مبتنی بر هوش مصنوعی و چتباتها از فناوریهای کلیدی در حال ظهور هستند که بازار آنها در سالهای گذشته رشد چشمگیری را تجربه کرده است.
مطابق «آمار چتباتها: ۲۰۲۰ و فراتر»، که Andy Peart در لینکدین منتشر کرده است، گردش مالی هوش مصنوعی مکالمهای رشد شایان توجهی را از سر میگذراند.
مطلب منتشرشدۀ Andy Peart اشاره میکند که مطابق گزارش Markets and Markets، انتظار میرود که اندازۀ بازار جهانی هوش مصنوعی مکالمهای از ۴.۲ میلیارد دلار آمریکا در سال ۲۰۱۹ میلادی تا ۱۵.۷ میلیارد دلار آمریکا در سال ۲۰۲۴ میلادی رشد کند، همچنین نرخ رشد مرکب سالیانۀ مورد انتظار برای آن ۳۰.۲ درصد است.
دستیارهای مجازی هوشمند و چتباتها دو دستۀ اصلی موجود در گزارش بازار هوش مصنوعی مکالمهای هستند.
نکتۀ درخور توجه این است که دستۀ چتباتها بازار بزرگتری را در طول بازۀ پیشبینی به خود اختصاص میدهد. آمارهای Research and States نشان میدهد که بازار چتباتها در سال ۲۰۱۸ میلادی ۱.۲ میلیارد دلار ارزش داشته است، درحالیکه انتظار میرود ارزش این بازار در سال ۲۰۲۴ میلادی به ۷.۵ میلیارد دلار برسد و در طول این مدت، رشد مرکب سالیانۀ ۳۴.۷۵ درصد را ثبت کند.
عوامل عمدهای که موجب رشد بازار چتباتها شده است شامل تقاضای فزاینده برای خدمات پشتیبانی مشتریان مبتنی بر هوش مصنوعی، استقرار اُمنیـچنل و هزینههای کاهشیافتۀ توسعۀ چتباتها میشود.
گزارشهای متعدد از منابع مختلف نشان میدهد که استفاده از چتباتها در صنایع مختلفی نظیر بانکداری، بیمه، خردهفروشی و حتی در کارهای اداری کارمندان یقهسفید رو به رشد بوده و موجب صرفهجوییهای درخور توجهی شده است. در مجموع، دادههای متعدد از منابع مختلف نشان میدهد که استفاده از چتباتها و تعامل با آنها رو به رشد است؛
بااینحال، انتخاب پلتفرم توسعۀ مناسب برای ساخت چتباتها تصمیمی کلیدی است.
مطابق گزارش گارتنر، شانزده شرکت از بین شرکتهایی که در زمینۀ توسعۀ دستیارهای هوشمند یا زیرساخت توسعۀ آنها فعالیت میکنند شاخصتر هستند. یکی از این شرکتها Rasa است که مطابق گزارش CBInsights2021 در بین برترین استارتاپهای حوزۀ هوش مصنوعی در سال ۲۰۲۱ در زمینۀ پردازش زبان طبیعی و هوش مصنوعی مکالمهای قرار دارد.
در این مجموعه مطالب، به معرفی پلتفرم رسا و بررسی مفاهیم اساسی توسعۀ دستیار هوش مصنوعی مکالمهای/ دستیارهای زمینهای با استفاده از این پلتفرم میپردازیم. در واقع این مجموعه مطالب برداشتی از ویدئوهای آموزشی رساست که هدف آن معرفی این پلتفرم، برخی مفاهیم استفادهشده در رسا و همچنین اشاره به برخی جنبههای عملی توسعه با پلتفرم رساست. درعینحال، اگر به توسعۀ دستیار شخصی هوشمند بر بستر پلتفرم رسا مایل باشید، خواندن این مطالب شما را از مراجعه به مطالب آموزشی رسا بینیاز نمیکند و توصیه میشود که برای توسعۀ چتبات به ویدئوهای آموزشی رسا در یوتیوب یا به کتابچۀ راهنمای جامع این شرکت مراجعه کنید.
همانطور که در شکل ۱ مشاهده میشود، عالیترین سطح توسعۀ دستیارهای هوش مصنوعی مکالمهای در حال حاضر دستیارهای زمینهای است.
مطابق آنچه در آموزشهای رسا آمده، در حال حاضر هنوز هم، استاندارد غالب صنعت برای توسعۀ چتباتها استفاده از FAQهاست (سطح ۲) که برای توسعۀ این چتباتها از مجموعهای از قوانین یا از ماشین وضعیت استفاده میشود. نکتۀ مثبت این رویکردها ساده کردن ساخت دستیارهاست، اما ازطرفی هم استفاده از این رویکردها برای ساخت چتباتها بسیار مستعد خطاست.
دستیارهای زمینهای سعی میکنند عملکرد دستیار را به مکالمۀ طبیعی انسانها شبیهتر کنند، یعنی همانطور که در مکالمههای انسانها، زمینه بسیار حائز اهمیت است، این دستیارها هم، با توجه کردن به زمینه، مکالمه را پیش میبرند، اگر بهصورت غیرمنتظره، مسیر مکالمه تغییر کند، آن را درک میکنند و بهطور متناسب به آن پاسخ میدهند.
منظور از زمینه این است که توجه کنیم کاربر قبلاً چه چیزی گفته، چه زمانی آن را گفته، کجا و چطور گفته و... و از این اطلاعات برای مدیریت و پیشبرد مکالمه استفاده کنیم.
اجزای پلتفرم رسا برای توسعۀ دستیارهای زمینهای
رسا مجموعهای از ابزارهای یادگیری ماشین منبعباز است که به توسعهدهندگان امکان میدهد تا دستیارهای هوش مصنوعی زمینهای را (متنی یا صوتی) توسعه دهند. پلتفرم رسا، برای ممکن کردن توسعۀ دستیارهای زمینهای، رویکرد مبتنی بر یادگیری ماشین را جایگزین رویکردهای مبتنی بر قوانین یا ماشینهای حالت کرده است.
پلتفرم رسا با استفاده از ۳ (۲ + ۱) مؤلفۀ اساسی این قابلیت را در اختیار توسعهدهندگان قرار میدهد:
- NLU: نوعی ابزار پردازش زبان طبیعی منبعباز برای طبقهبندی اینتنت و استخراج انتیتی.
این مؤلفه، به تعبیری، گوش سیستم شماست که کمک میکند دستیار شما متوجه شود چه چیزی گفته شده است.
این مؤلفه ورودی کاربر را در قالب غیرساختیافتۀ زبان انسان دریافت میکند و دادههای ساختیافته را در قالب اینتنت و انتیتی از آن استخراج میکند. اینتنت را میتوان برچسبهایی در نظر گرفت که باتوجهبه هدف کلی کاربر از پیامش، به هر ورودی کاربر نسبت داده میشود. انتیتیها مجموعه اطلاعاتی هستند که دستیار ممکن است در هر زمینۀ خاص به آن نیاز داشته باشد.
نمونهای از استخراج اینتنت و انتیتی از مکالمۀ کاربر در شکل ۲ نشان داده شده است.
دستیار باید My name را از ورودی استخراج کند و آن را در طول مکالمه به خاطر بسپارد تا تعامل را طبیعی نگاه دارد. این کار از طریق تعلیم یک مدل NER بهمنظور شناسایی و استخراج انتیتیها از پیامهای غیرساختیافتۀ کاربران انجام میشود.
- Core یا Dialogue Management: چارچوبی برای تصمیمگیری زمینهای بر اساس یادگیری ماشین.
وظیفۀ این مؤلفه در رسا مدیریت دیالوگهای کاربران است.
این مؤلفه، به تعبیری، مغز سیستم شماست و بر اساس وضعیت (state)، بهخصوص مکالمه و زمینه، پیشبینی میکند که چه پاسخی باید به کاربر داده شود.
نمونۀ پیشبینی ماژول مدیریت دیالوگ از پاسخی که دستیار باید ارائه کند در شکل ۳ نشان داده شده است.
مؤلفۀ Core اینها را از طریق مشاهدۀ الگوهایی از دادههای مکالمهای نمونه، که بین کاربر و دستیار انجام شده است و به آنها story هم گفته میشود، یاد میگیرد.
سؤالی که ممکن است ذهن شما را درگیر کرده باشد این است که مؤلفۀ Core، زمینۀ (context) را چطور حفظ میکند؟
بهطور خلاصه، مدل یادگیری ماشین نگاه میکند که مکالمه در حال حاضر دربارۀ چیست و همچنین به عقب نگاه میکند تا ببیند که پیشتر چهچیزی گفته شده است. علاوه بر این، ماژول مدیریت دیالوگ، جزئیات دیگری را نیز در نظر میگیرد. برای مثال، اطلاعاتی که مؤلفۀ NLU استخراج کرده است (چراکه برخی انتیتیها که بعدتر از آنها بهعنوان slot استفاده میشود ممکن است روی چگونگی پیشبینی اقدام بعدی سیستم Dialogue Management بهطور مستقیم تأثیر داشته باشند).
- Rasa X
مؤلفۀ Rasa X این قابلیت را ایجاد میکند که دستیار از مکالمههای جدید یاد بگیرد و در طول زمان عملکرد آن بهبود پیدا کند.
عملکردهایی که Rasa X انجام میدهد تا دستیار در طول زمان بهبود پیدا کند در شکل ۴ نشان داده شده است.
نحوۀ عملکرد انتها تا انتهای رسا در تعامل با کاربر و با استفاده از مؤلفههای سهگانه در شکل ۵ نشان داده شده است.
در مطالب بعدی به معرفی بیشتر اجزای NLU و Core و چگونگی عملکرد آنها میپردازیم.
منابع
- Peart, A. (2020, May 19). Chatbot Statistics: 2020 & Beyond. Linkedin. https://www.linkedin.com/pulse/chatbot-statistics-2020-beyond-andy-peart/, Last accessed July 2021.
- Meese M. (2021, April 8). CB Insights reveals 2021 cohort of 100 most-promising AI companies. TechRepublic. https://www.techrepublic.com/article/cb-insights-reveals-2021-cohort-of-100-most-promising-ai-companies/, Last accessed July 2021.
- Revang, M., Baker, V., Manusama, B., Mullen, A., and Lee, A. Market Guide for Conversational Platforms. Gartner. https://www.gartner.com/en/documents/3953723/market-guide-for-conversational-platforms, Last accessed July 2021.
- Rasa. (2019, October). Rasa Masterclass: Developing Contextual AI assistants with Rasa tools. https://www.youtube.com/playlist?app=desktop&list=PL75e0qA87dlHQny7z43NduZHPo6qd-cRc, Last accessed July 2021.
- The Rasa Masterclass Handbook. 2019. The Rasa Masterclass Handbook; A Companion Guide to the Rasa Masterclass Video Series. Rasa Publication, 2019, https://cdn2.hubspot.net/hubfs/6711345/ebook-v3.pdf?__hstc=&__hssc=&hsCtaTracking=2cf912f3-4137-4338-829e-08bb4713f0f6%7Cda22eae5-512d-48fe-b46a-c74517f3d870.
مطلبی دیگر از این انتشارات
Let's Go: Error Handling
مطلبی دیگر از این انتشارات
پنجرههای شکسته را شوق تماشا نیست!
مطلبی دیگر از این انتشارات
چگونه در توسعه محصول به «تمرکز» برسیم؟!