سرویسهای متنکاوی و پردازش متن فارسییار
سطوح (اجزای) زبانهای طبیعی
مقدمه
زبان متشکل از سطوح مختلف دانش است. در منابع مختلف سطوح و اجزای مختلفی برای زبان طبیعی (استفاده شده برای انسانها) قائل هستند که در این مقاله دستهبندی متداول هفت سطحی آن بیان میشود:
1- آوا شناسی (Phonetics)
این سطح به تشخیص آواها و صداها و بازشناسی گفتار میپردازد. شاخهای از زبان شناسی است که مطالعه اصوات گفتار انسان را تشکیل میدهد و با خواص فیزیکی اصوات گفتاری (آواها) ارتباط دارد که عبارتند از: تولید فیزیولوژیکی آنها، خواص آکوستیک، درک مخاطب و وضعیت نروفیزیولوژیکی از سوی دیگر، واج شناسی به تعیین مشخصات گرامری چکیده سیستمهای اصوات مربوط میشود.
2- واجشناسی (Phonology)
این سطح به بررسی واج یا هجا (بخش)ها در کلمات میپردازد. یکی از زیرشاخههای زبانشناسی است که به بررسی نظام آوایی زبان میپردازد و جایگاه عناصر آوایی زنجیری و زبرزنجیری را در نظام زبان مشخص میکند. در این حوزه، مسائلی مانند آوا، واج، واجگونه، گام یا پایه، هجا، کلمه واجی، تکیه، آهنگ، رکن و وزن شعر مورد بررسی قرار میگیرند.
3- ریخت شناسی (Morphology)
این سطح به ساختارهای کلمات و ریشهیابی واژگان میپردازد. بخشی از دستورِ زبان است که ساختــار واژه را مورد تحلیل قرار میدهد. به عبارت دیگر، ساختِواژه به شناختِ تکواژها و راههایِ همنشینیِ آنها با یکدیگر در قالبهایِ نحوی و نیز در واژهسازی میپردازد. کارِ اصلی در این سطح، تجزیهی عبارتها و جملهها و دست یافتن به تکواژها و واژهها و سپس دستهبندیِ آنها بر اساسِ ردههایِ دستوریِ آن زبان میباشد.
در زبان شناسی، تکواژ شناسی یعنی بازشناسی، تحلیل و توصیف ساختار تکواژها و دیگر واحدهای معنایی در زبان از قبیل کلمات، وندها و هویت دستوری و همچنین تکیه/استرس و بافتار ضمنی (کلمات در واژه نامه موضوع اصلی واژه شناسی میباشد.).
4- نحو (Syntax)
این سطح به ارتباط کلمات به همدیگر و مباحث دستوری آنها در گروهها و جملات میپردازد از اینرو به آن جملهشناسی نیز میگویند. به دانش مطالعهی قواعد مربوط به نحوهی ترکیب و در کنار هم آمدن واژهها به منظور ایجاد و درک جملات در یک زبان اطلاق میشود. این شاخه ی مهم از دستور هر زبان نظاممندی و خلاقیت فراوانی را طلب مینماید. درست است که انسانها میتوانند مجموعه کلمات یک جمله را با ترتیب گوناگونی در کنار هم قرار دهند ولی تمامی آنها جملات معنیدار نخواهند شد.
5- معناشناسی (Semantics)
این سطح به ارتباطات معنایی اصلی کلمات در متن و ابهامزدایی مفاهیم میپردازد. دانش بررسی و مطالعهی معانی در زبانهای انسانی است. این علم معمولاً بر روی رابطه بین دلالت کنندهها مانند لغات، عبارتها، علائم و نشانهها و اینکه معانیشان برای چه استفاده میشود تمرکز دارد. مفاهیم زبانشناسی و زبانشناسی معنایی بررسی معانی است که توسط انسانها برای نشان دادن خودشان در طول زبان استفاده میشود.
6- عملگرایی (Pragmatics)
این سطح کاربردهای زبان برای رساندن یک مطلب به مخاطب یا مخاطبان، در حالت عملی و یا در نوشتار و گفتار طبیعی میپردازد. واحد مورد مطالعه در این سطح قصد (Intention) میباشد. معنی را به هنگام کاربرد و در ارتباط با جهان خارج مورد مطالعه قرار میدهد. جملات اگر در موقعیت مناسب خود به کار نروند، نمیتوانند در ایجاد ارتباط سهمی داشته باشند. ما در مقام گوینده میدانیم در هر موقعیتی چگونه صحبت کنیم و در مقام مخاطب نیز میدانیم در برابر آنچه میشنویم، منظور و هدف گوینده پیست و ما باید چه واکنشی نشان دهیم.
7- گفتمان یا مباحثه (Discourse)
این سطح به ارتباطات کلی یک زبان فرای یک یا چند جمله خاص میپردازد. تحلیل کلام اصطلاحی کلی برای اطلاق به مطالعاتی است که زبان نوشتاری، گفتاری یا نشانهای یا هر گونه پدیده نشانهشناختی را مورد تجزیه و تحلیل قرار میدهند. در نگاه نخست شاید تحلیل گفتمان همان تحلیل متن یا نوشتار یا تحلیل گفتار به نظر آید. اما واقعیت این است که تحلیل گفتمان چیزی بیش از آرای برخی دانشمندان درباره تحلیل فرستنده، تحلیل پیام، تحلیل وسیله و تحلیل گیرنده است. تحلیل گفتمان عبارت است از شناخت رابطه جملهها با یکدیگر و نگریستن به کل آن چیزی که نتیجه این روابط است. در تحلیل گفتمان، برخلاف تحلیلهای سنتی زبانشناسان، دیگر صرفا با عناصر نحوی و لغوی تشکیل دهنده جمله به عنوان عمدهترین مبنای تشریح معنا سرو کار نداریم، بلکه فراتر از آن به عوامل بیرون از متن، یعنی بافت موقعیتی، فرهنگی، اجتماعی، سیاسی، ارتباطی و غیره سرو کار داریم.
استفاده از این مقاله با ذکر منبع (سامانه متن کاوی فارسییار)، بلامانع است.
مطلبی دیگر از این انتشارات
معرفی بهترین کتابخانههای پردازش متن - بخش سوم (Polyglot, Gensim, NLP Curator)
مطلبی دیگر از این انتشارات
مقدمهای بر نظرکاوی (تحلیل حس) و کاربردهای آن
مطلبی دیگر از این انتشارات
معرفی بهترین کتابخانههای پردازش متن - بخش پنجم (GATE, RapidMiner, MALLET, FreeLing)