سرویسهای متنکاوی و پردازش متن فارسییار
برچسبزن نقش معنایی (Semantic Role Labeling - SRL)
برچسب گذاری نقش معنایی (Semantic Role Labeling) یا SRL ابزاری برای تشخیص نقش معنایی کلمات و اجزای جمله است. این ابزار یکی از مهمترین ابزارهای پردازش زبان طبیعی بوده و نقش بسزایی در پردازشهای زبانی و درک منظور نوشته (متن) دارد. برای آشنایی با سایر ابزارهای پردازش زبانهای طبیعی به این مقاله مراجعه فرمایید.
دقت ابزار SRL بسیار حائز اهمیت است. وظیفه اصلی این ابزار تشخیص نقشهای معنایی کلمات در جمله مانند: عامل (agent)، هدف (goal)، فعالیت (action)، نتیجه (result) و ... است. معمولاً نقشهای معنایی مختلف بر محور ارتباط آنها با بخش گزاره یا فعل جمله مشخص میشوند. برای مثال در تمام جملات زیر بصورت یکسان، فعل "فروختن/خریدن" به عنوان گزاره جمله یا رویداد و عمل انجام شده است و "احمد" دارای نقش عامل (agent)، "ماشین" کالا یا زمینه و موضوع (theme) جمله و "پژمان" به عنوان دریافتکننده است.
- احمد ماشینش را به پژمان فروخت.
- پژمان ماشین احمد را خرید.
- ماشین احمد توسط پژمان خریداری شد.
- ماشین احمد به پژمان فروخته شد.
- فروش ماشین احمد به پژمان ...
پس هدف اصلی این ابزار، فهم معنای جمله و اطلاعات بیان شده در متن است. تحلیل معنایی انجام شده در این ابزار دارای درجه انتزاعی کمتری (عینی بیشتر) نسبت به تجزیهگر جمله است. به عبارت دیگر، برچسبزنی نقش معنایی دستههای (برچسبهای) بیشتر و دقیقتری را نسبت به پارسر تولید میکند. پس طبیعتاً در خروجی این ابزار شاهد واحد یا گروههای کلمات ایجاد شده، کوتاهتر (کوچکتر) هستیم.
به عنوان مثال در جمله «پیامبر خاتم صل الله علیه و آله با جمع کردن مردم در غدیر، امام علی علیه السلام را به همه مسلمانان به عنوان جانشین خود معرفی نمود»؛ ابتدا در این ابزار فعل "معرفی نمودن" را به عنوان گزاره شناسایی میکند. سپس "پیامبر صل الله علیه و آله" که عمل انتساب جانشینی را انجام داده است به عنوان نقش عامل (Agent) و "امام علی علیه السلام" به عنوان دریافتکننده (Recipient)، "جانشینی پیامبر" به عنوان موضوع یا زمینه (Theme)، "همه مسلمانان" نیز به عنوان ذینفعان (Beneficiary)، "جمع کردن مردم" به عنوان ابزار (Instrument) و "غدیر" به عنوان مکان (Location) جمله در نظر گرفته میشود.
در واقع برچسبزن نقش معنایی به دنبال پاسخ به سوالات "چه کسی، چه عملی را برای/درباره چه کس/چیزی انجام داد؟" در جمله میگردد. لذا نوعاً نقشهای گرامری از قبیل فعل (گزاره یا نوع عمل و رویداد)، فاعل (بوسیله عامل)، مفعول مستقیم و غیرمستقیم (بوسیله نقش دریافتکننده و موضوع یا مضمون) و … در این ابزار شناسایی میشوند.
برای تولید این ابزار اغلب از رویکرد تجزیهگر نحوی (پارسر) و استفاده از رویکرد یادگیری ماشین استفاده میشود. به عنوان منبع (جهت آموزش مدلهای یادگیر) پیکرههایی در زبان انگلیسی از جمله FrameNet و PropBank گردآوری و منتشر شده است.
در ذیل به چند نمونه از ابزارهای SRL که اغلب برای زبان انگلیسی و آلمانی هستند، اشاره شده است:
- Mate tools - demo
- Stanford SRL - demo
- Illinois SRL - demo
- AllenNLP - demo
- PathLSTM
- MatePlus
- PractNLPTools
- BioKIT - For biomedical text
استفاده از این مقاله با ذکر منبع (سامانه متن کاوی فارسییار - text-mining.ir)، بلامانع است.
مطلبی دیگر از این انتشارات
فراخوان مشارکت عمومی برای کمک به زبان فارسی
مطلبی دیگر از این انتشارات
معرفی بهترین کتابخانههای پردازش متن - بخش پنجم (GATE, RapidMiner, MALLET, FreeLing)
مطلبی دیگر از این انتشارات
مفاهیم اولیه پردازش زبان طبیعی