خواندن ۸ دقیقه·۵ سال پیش

مراحل انجام پژوهش پیکره‌ای

در این نوشته، فصل آخر (نتیجه گیری = conclusion) کتاب معرفی زبان شناسی پیکره ای (Introduction to Corpus Linguistics) نوشته ی ساندرین زافری (Sandrine Zufferey) را به پیشنهاد دوست و همکار عزیزم، آقای امیر احمدی، خلاصه کردم. این کتاب را نوامبر 2020 انتشارات ویلی چاپ کرده. 288 صفحه است و هدفش این است که اصول و روش های «مطالعات کمّی» (quantitative methods) در زبان شناسی را معرفی کند که شامل زبان شناسی پیکره ای و زبان شناسی تجربی (Empirical Linguistics) می شود. عنوان فصل ها و بخش های مختلف کتاب را این جا آورده ام (ممکن است ترجمه ای که کرده ام دقیق نباشد).

نکته این که آقای محمدحسن ترابی با همکاری نشر نویسه در حال ترجمه ی این کتاب است و امیدوارم به زودی چاپ بشود. قطعن با این ترجمه، می توانید راحت و روان کتاب را بخوانید.

فصل اول: چطور زبان شناسی پیکره ای را تعریف کنیم

تعریف عناصر، خردگرایی (rationalism) در مقابل تجربه گرایی در زبان شناسی، استدلال های چامسکی علیه تجربه گرایی در زبان شناسی، زبان شناسی پیکره ای و ابزارهای رایانه ای، روش های کمی در مقابل کیفی، تفاوت های زبان شناسی پیکره ای و زبان شناسی تجربی، انواع مختلف پیکره.

فصل دوم: چطور از پیکره ها در زبان شناسی نظری استفاده کنیم

آواشناسی، واج شناسی، ساختواژه، نحو، واژگان، تحلیل گفتمان، کاربردشناسی، زبان شناسی اجتماعی، زبان‌شناسی درزمانی.

فصل سوم: چطور از پیکره ها در زبان شناسی کاربردی استفاده کنیم

فراگیری زبان، اختلال زبانی، فراگیری زبان دوم، تدریس زبان، فرهنگ نویسی، سبک شناسی، زبان شناسی حقوقی.

فصل چهارم: چطور از پیکره های چندزبانه استفاده کنیم

پیکره های مقایسه ای و موازی، در جستجوی «مقایسه ی سوم» (tertium comparationis)، ترجمه به عنوان ژانر گفتمانی، پیکره های چندزبانه و زبان شناسی مقابله ای، پیکره های موازی و مطالعات ترجمه، پیکره های موازی و فرهنگ لغت های دوزبانه.

فصل پنجم: چطور پیکره های زبان فرانسوی را پیدا و تحلیل کنیم

فرمت های پیکره ها و توانایی های آنها، پیکره های مرجع، پیکره های نوشتاری فرانسوی، پیکره های گفتاری فرانسوی، کودکان و پیکره های زبان آموز، پیکره های چندزبانه ی شامل زبان فرانسوی، ابزارهای مشاوره ای پیکره (فهرست های واژه نما، واژه نمای انت کانک، واژه نمای CLAN).

فصل ششم: چطور یک پیکره بسازیم

پیش از تصمیم برای ساخت یک پیکره، تعیین اندازه و ویژگی نمایندگی کردن داده ها، انتخاب نمونه های زبانی، آماده سازی و مرتب سازی فایل های پیکره، موضوعات قانونی و اخلاقی.

فصل هفتم: چطور یک پیکره را برچسب بزنیم

برچسب زنی های پیکره، انواع برچسب زنی، استاندارد طرح های برچسب زنی، مراحل فرایند برچسب زنی، ابزارهای برچسب زنی، اندازه گیری کمیت و روایی برچسب زنی، به اشتراک گذاری برچسب زنی خود.

فصل هشتم: چطور داده های پیکره ای را تحلیل کنیم

آمارهای توصیفی برای داده های پیکره ای، اندازه گیری غنای واژگانی یک پیکره، اندازه گیری پراکندگی واژگانی یک پیکره، مقدمات آمار استنباطی، متغیرهای مرسوم در مطالعات پیکره، اندازه گیری تفاوت بین دسته ها.

نتیجه گیری: مراحل انجام یک پژوهش پیکره ای (که در این نوشته، خلاصه‌اش را آورده ام).

کتاب معرفی زبان شناسی پیکره ای (Introduction to Corpus Linguistics) نوشته ی ساندرین زافری (Sandrine Zufferey) [عکس از صفحه ی کتاب در انتشارات ویلی]

خانم ساندرین زافری، نویسنده ی کتاب [عکس از گوگل اسکالر]

خب برویم سراغ خلاصه‌ی فصل آخر کتاب: نتیجه گیری.

مرحله ی صفر: بیشتر دانستن

قبل از شروع پژوهش، باید به موضوع مورد علاقه تان و ایده ی کلی که دارید فکر کنید. ایده ای که در این مرحله لزومن واضح نیست. مثلن تفاوت مرد و زن و چگونگی بازتابش در زبان. یا مثلن پژوهش درباره ی زبان کودکان یا ورزش، تاریخ، سیاست و چیزهای کلی دیگر. خوبی زبان شناسی این است که با رشته های مختلف می تواند ترکیب شود. علاقمندی و ایده ی کلی که در این مرحله به آن می رسید، لزومن پرسشی علمی نیست که با داده های تجربی بشود بررسی کرد.

مرحله ی یک: یافتن پیشینه ی مرتبط

حالا وقت این است که اسناد مرتبط را پیدا کنید. پژوهش های پیکره بنیاد معمولن می خواهند فرضیه های تجربی را که قبلن از نتایج پژوهش های دیگر مطرح شدند بررسی کنند؛ چه فرضیه هایی که خیلی نظری و انتزاعی هستند و چه فرضیه هایی که تجربی هستند. فرضیه هایی که در پیشینه های علمی منتشر شده اند.

مثلن می توانید مجلات زیر را بررسی کنید:

Corpus Linguistics and Linguistics Theory
International Journal of Corpus Linguistics
Corpora
این سه از مجله های ویژه ی پیکره هستند. به جز این ها، Journal of Language Resources and Evaluation هم هست که معمولن مقالاتی در رابطه با جنبه های روش شناسی مرتبط با پیکره را چاپ می‌کند. می شود هم مجلاتی را دید که مقالات خاص انواع دیگر زبان شناسی را چاپ می کنند. مثل:
Journal of Pragmatics
Journal of Sociolinguistics
Journal of French Language Studies

مجلاتی که معمولن پژوهش های پیکره ای هم چاپ می کنند. در فصل 2 تا 4 کتاب مثال های زیادی از این دست مطالعات گفته شده (همچنین می توانید بخش «مطالعات بیشتر» در هر فصل را ببینید).

برای بررسی این مجلات هم می توانید کلمات کلیدی کار خودتان را در سایت خود مجلات ببینید، هم می توانید از گوگل اسکالر استفاده کنید (که بیشتر مقالات علمی در آن ثبت شده اند) و هم می توانید از پایگاه های داده ی دیگر مثل اسکوپس (Scopus) استفاده کنید (اسکوپس پولی است).

دسترسی به اصل مقالات معمولن پولی است اما اگر از روش Open Access استفاده کرده باشند، نیاز به پرداخت هزینه ندارید. کتابخانه های دانشگاه ها معمولن دسترسی آنلاین رایگان به بسیاری از مجلات را از طریق شبکه ی داخلی دانشگاه ممکن می کنند. اگر این کار هم ممکن نشد می توانید سایت یا صفحه ی نویسنده های مقالات را در ResearchGate یا Academia ببینید. بعضی از نویسنده ها، مقالاتشان را رایگان منتشر می کنند. برای پیدا کردن این موارد، بهتر است اسم مقاله را مستقیم در موتور جستجو (مثلن گوگل) بزنید.

مرحله ی دو: تنظیم فرضیه های پژوهش

توی مرحله ی قبل، مطالعات مرتبط را پیدا کردیم. این جا باید فرضیه های پژوهش را برای مطالعه ی سوال پژوهش مشخص کنیم. این فرضیه ها از نتایج پژوهش های قبلی استخراج می شوند و هدفشان می تواند تکمیل نتایج قبلی (مثلن با آزمایش متغیرهای جدید) باشد. فرضیه ها باید از نظر تجربی، قابل آزمایش باشند. یعنی باید به صورت واضح متغیرها و روابط احتمالی بین آنها را مشخص کند. برای هر فرضیه، باید فرضیه صفر متناظرش را هم تعیین کرد که بشود با استفاده از آزمون های آماری بررسی اش کرد.

مرحله ی سه: اجرای فرضیه ها و انتخاب داده ها

این مرحله برای پژوهشی تجربی خیلی مهم است. در این مرحله باید تعیین کنیم که متغیرها چه طور باید اندازه‌گیری شوند. مثلن می خواهیم بررسی کنیم که آیا زنان احساسی تر از مردان حرف می زنند یا نه. پس یک راهکار این است که مجموعه واژه های احساسی را استخراج کنیم و ببینیم مردان بیشتر به کارشان می برند یا زنان.

کار دیگری که در این مرحله باید بکنیم، انتخاب پیکره ی مناسب است. ممکن است پیکره های موجود برای کار ما خوب باشند و ممکن است مجبور شویم خودمان یک پیکره بسازیم. در مثال احساسی حرف زدن مردان و زنان، متن های پیکره باید فراداده ی «جنسیت نویسنده» داشته باشند. از طرف دیگر احتمال احساسی حرف زدن در مکالمه‌های عادی بیشتر است تا در متنی علمی. پس با توجه به سوال پژوهش، باید نوع پیکره را هم در نظر بگیریم.

مرحله ی چهار: استخراج و برچسب گذاری داده های پیکره

حالا وقتش است که بهترین استراتژی برای استخراج داده‌های مرتبط را بفهمیم. در همان مثال قبلی، شاید استراتژی خوب، جستجوی واژه های احساسی در متن است. در بیشتر موارد بعد از اجرای استراتژی استخراج داده ها، باید داده‌ها را دستی هم کنترل کنیم. مثلن در این مثال همه ی کاربردهای واژه ی like بافت احساسی ندارند و خیلی جاها این واژه به معانی دیگر به کار می رود. جستجو همچنین می تواند با کمک تحلیل های قبلی پیکره انجام شود. مثلن اگر پیکره lemmatize شده باشد یا برچسب های POS داشته باشد، این موارد ممکن است بتوانند به پژوهش ما کمک کنند.

همچنین ممکن است داده های خامی که استخراج کردیم کافی نباشند و لازم باشد برچسبشان بزنیم. در این موارد باید طبقه بندی برچسب ها را به صورت دقیق تشخیص بدهیم و چندین برچسب زن به صورت مستقل، کار برچسب زنی را انجام دهند و جمع بندی برچسب ها بر اساس معیار و مرز مشخصی انجام شود.

مرحله ی پنج: تحلیل داده ها

بعد از استخراج داده های مرتبط، حالا می توانیم داده ها را تحلیل کنیم. داده ها باید قابل مقایسه باشند. مثلن در مورد بسامد واژه ها، این بسامدها باید نرمال سازی شوند و بر اساس معیار مشخصی (مثلن درصد تکرار) بیان شوند. بعد آمارهای توصیفی ارائه شوند و بعد آمار استنباطی تا بشود نتایج پژوهش را به کل جامعه‌ی آماری تعمیم داد. انتخاب آزمون آماری، بستگی به فرضیه ها و نوع متغیرها دارد.

مرحله ی شش: ارائه ی پژوهش در قالب گزارش یا مقاله

بعد از انجام همه ی مراحل بالا، باید نتایج پژوهشمان را در قالب یک گزارش یا مقاله، آماده ی ارائه کنیم. هدف ما در کل این فرایند، بررسی داده های تجربی برای یک نتیجه گیری کمّی درباره‌ی فرضیه‌هایی است که در مرحله‌ی دوم آماده کردیم. گزارش یا مقاله معمولن از ساختارب خیلی دقیق پیروی می کنند:

1- در بخش معرفی، پرسش پژوهش و ضرورتش توضیح داده می شود: introduction

2- در بخش پیشینه ی پژوهش، پژوهش های مشابه قبلی معرفی می شوند و پایه های نظری پژوهش توضیح داده می شود: state of the art

3- در بخش سوم فرضیه هایی که در پی اثباتشان هستیم گفته می شوند: hypotheses

4- بقیه ی سند علمی ما نتایج پژوهش را نشون می دهد (corpus study). اول پیکره ی مورد استفاده را توضیح می دهیم (data) و می گوییم که چطور داده ها را از آن استخراج کرده ایم و برچسب گذاری کرده ایم (procedure, extraction, annotation). بعد نتایج را با جزئیات بیان می کنیم و نتایج آزمون های آماری را با فرمت دقیقی که برایش وجود دارد، بیان می کنیم (results)، درباره ی نتایج کمی بحث می کنیم و می گوییم که فرضیه ها اثبات شدند یا نه (discussion of the study) و در نهایت نتیجه‌گیری مختصرمان از نتایج نهایی و زمینه های پژوهشی بیشتر را می گوییم (conclusion).

نتیجه گیری

اگر طبق این مراحل کار پیکره ای خودمان را پیش ببریم، می توانیم بگوییم کاری علمی روی زبان کردیم که می‌تواند نقطه‌ی شروع پژوهش های بعدی باشد و پژوهشگران دیگر از کار شما به خوبی استفاده کنند. معمولن نتایج داده های تجربی، نظریه های فعلی را تغییر یا بهبود می دهند.

در بخش های مختلف کتاب، مواردی که در این نوشته گفته شد، مفصل توضیح داده شده اند.

معرفی کتابزبان‌شناسیعلم تجربی

امیرحسین مجیری

بذارید بهش فکر کنم. طبقه‌بندی مطالب در «انتشارات».

شاید از این پست‌ها خوشتان بیاید

امیرحسین مجیری

خواندن ۸ دقیقه·۵ سال پیش

مراحل انجام پژوهش پیکره‌ای

فصل اول: چطور زبان شناسی پیکره ای را تعریف کنیم

فصل دوم: چطور از پیکره ها در زبان شناسی نظری استفاده کنیم

فصل سوم: چطور از پیکره ها در زبان شناسی کاربردی استفاده کنیم

فراگیری زبان، اختلال زبانی، فراگیری زبان دوم، تدریس زبان، فرهنگ نویسی، سبک شناسی، زبان شناسی حقوقی.

فصل چهارم: چطور از پیکره های چندزبانه استفاده کنیم

فصل پنجم: چطور پیکره های زبان فرانسوی را پیدا و تحلیل کنیم

فصل ششم: چطور یک پیکره بسازیم

فصل هفتم: چطور یک پیکره را برچسب بزنیم

فصل هشتم: چطور داده های پیکره ای را تحلیل کنیم

نتیجه گیری: مراحل انجام یک پژوهش پیکره ای (که در این نوشته، خلاصه‌اش را آورده ام).

خب برویم سراغ خلاصه‌ی فصل آخر کتاب: نتیجه گیری.

مرحله ی صفر: بیشتر دانستن

مرحله ی یک: یافتن پیشینه ی مرتبط

مثلن می توانید مجلات زیر را بررسی کنید:

Corpus Linguistics and Linguistics Theory
International Journal of Corpus Linguistics
Corpora
این سه از مجله های ویژه ی پیکره هستند. به جز این ها، Journal of Language Resources and Evaluation هم هست که معمولن مقالاتی در رابطه با جنبه های روش شناسی مرتبط با پیکره را چاپ می‌کند. می شود هم مجلاتی را دید که مقالات خاص انواع دیگر زبان شناسی را چاپ می کنند. مثل:
Journal of Pragmatics
Journal of Sociolinguistics
Journal of French Language Studies

مرحله ی دو: تنظیم فرضیه های پژوهش

مرحله ی سه: اجرای فرضیه ها و انتخاب داده ها

مرحله ی چهار: استخراج و برچسب گذاری داده های پیکره

مرحله ی پنج: تحلیل داده ها

مرحله ی شش: ارائه ی پژوهش در قالب گزارش یا مقاله

1- در بخش معرفی، پرسش پژوهش و ضرورتش توضیح داده می شود: introduction

2- در بخش پیشینه ی پژوهش، پژوهش های مشابه قبلی معرفی می شوند و پایه های نظری پژوهش توضیح داده می شود: state of the art

3- در بخش سوم فرضیه هایی که در پی اثباتشان هستیم گفته می شوند: hypotheses

نتیجه گیری

در بخش های مختلف کتاب، مواردی که در این نوشته گفته شد، مفصل توضیح داده شده اند.

معرفی کتابزبان‌شناسیعلم تجربی

امیرحسین مجیری

بذارید بهش فکر کنم. طبقه‌بندی مطالب در «انتشارات».

شاید از این پست‌ها خوشتان بیاید