کارشناسی ارشد مهندسی کامپیوتر | طراح تجربه کاربری و علاقهمند به علوم شناختی
زبان ۳
پردازش زبان طبیعی (Natural Language Processing) یعنی فهم و بازتولید زبانهایی که انسان با اون ها گفتوگو میکنه در حال حاضر طرفداران زیادی بین متخصصین هوش مصنوعی داره. آلن تورینگ با تعریف هوش مصنوعی در سال ۱۹۵۰ نشون داد برای اینکه ماشینی، هوشمند درنظر گرفته بشه باید بتونه صحبتهای انسان رو پردازش و بعد پاسخی براش تولید کنه. چند سال بعد برای اولین بار پروژه ترجمه ماشینی کلید خورد. در این پروژه قرار بود متون روسی به انگلیسی برگردوندهبشن. پیشبینی برای انجام پروژه ۳ تا ۵ سال بود اما پس از حدود ۱۲ سال بدون داشتن نتیجه چشمگیر بودجه این پروژه بهشدت کاهش دادهشد.(این اتفاق حدود سال ۱۹۶۶ در پاییز شبکه عصبی رخداد.) اما از نسخههای نسبتا موفق در اون دوران میشه به ELIZA که توسط جوزف ویزنباوم ساخته شده بود و یک شبیهساز روان-درمانی فردمحور یا بهطور کلی یک سیستم پرسشو پاسخ بود، اشارهکرد.
در شروع NLP زبان به صورت قائدهمند پردازش میشد یعنی تاکید بر استفاده از قواعد پیچیده گرامری یا ریشهیابی لغات بود. در دهه ۸۰ میلادی بعد از "انقلاب آماری" پردازش زبان طبیعی بر یادگیری ماشین استوار شد. بسیاری از روشهای یادگیری ماشین برای پردازش متن امتحان شدند. ورودی این الگوریتمها مجموعه بزرگ از ویژگیها ( مثلا درخت تصمیم پیچیده گرامری ) بود. اما تحقیقات بهطور فزایندهای بر روشهای آماری تمرکز داشتن، که تصمیماتی نرم و احتمالاتی، مبتنی بر الصاق وزنهای حقیقی-مقدار به هر ویژگی ورودی، میگیرن.
بخش زیادی از دادهها مثل گفتار، دادههای مبتنی بر زمان، ویدئو و البته متن، دادههای سری یا سریالی گفتهمیشن. برای پردازش این دادهها از شبکههای عصبی بازگشتی (RNN)، که برای پردازش دادههای سری ساخته شده، استفاده میکنیم. اما در پردازش متن همیشه این سوال وجود داشته که یک متن دنبالهای از چیه؟ جملات؟ کلمات؟ حروف؟ این موضوع هنوز در تحقیقات بررسی میشه اما در حال حاضر ما یک متن رو دنبالهای از کلمات در نظر میگیریم.
ایده اصلی در استفاده از شبکههای بازگشتی در متن به اینصورت هست که یک عملیات برای تک تک المانهای یک دنباله (کلمه،جمله،…) انجام میشه و خروجی اون وابسته به ورودی فعلی و عملیاتهای قبلیه. این ایده از طریق تکرار یک خروجی از شبکه در زمان با ورودی شبکه در زمان انجام میشه.(یعنی خروجی از مرحله قبل با ورودی تازه در مرحله جدید ترکیب میشن.) این چرخهها موجب ورود اطلاعات از یک گام زمانی به گام زمانی بعدی رو میشه. بعبارت بهتر این نوع شبکه ها دارای حلقه ای در درون خوداند که بوسیله اون میتونن اطلاعات را در حین خوندن ورودی از نورونها عبور بدن.
در حال حاضر کارهای جذابی در این زمینه انجام میشه. ترجمه ماشینی، تولید متن و شعر، خلاصهسازی متن، سیستم های پرسشوپاسخ(چندتا از این سرویسها رو در پایین لینک دادم) از مثالهای مهمی هستند که در تیم های پردازش متن روشون کار میشه.
برای خوندن دقیقتر در مورد نحوه پردازش متن با شبکههای عصبی میتونید از لینک زیر استفاده کنید. و برای شروع یادگیری در این زمینه دیدن کورس Sequence Models از اندرو انجی در سایت https://www.coursera.org بهترین تصمیمه.
مطلبی دیگر از این انتشارات
آموزش تبدیل عکسهای دوبعدی به سهبعدی با دیپلرنینگ
مطلبی دیگر از این انتشارات
رویداد «روز هوشمصنوعی» (AI Day) | گردهمایی متخصصان علم داده ایران و جهان
مطلبی دیگر از این انتشارات
مِهداده (کلان داده) چیست؟ (۵)