آیا فصل ۸ Game of Thrones واقعا اینقدر بد بود؟

منتشر‌شده در : towardsdatascience به تاریخ ۳ ژوئن ۲۰۲۱
لینک منبع Was Game of Thrones Season 8 really that bad?

من به تازگی شروع به بازبینی گیم آو ترونز کردم، که از فصل ۱ شروع شد. از آنجا که من از ابتدا طرفدار نسبتا متعهد این مجموعه بودم، فکر می‌کردم که فصل ۸ تا حد زیادی ناامید کننده است. به طور خاص‌تر، خطوط طرح یا رها شده بودند و یا عجله کرده بودند، و من تقریبا با هر چیزی که در داستان اتفاق افتاد موافق نبودم. به نظر می‌رسید که افراد دیگری هم در آن زمان همین فکر را می‌کردند.

بنابراین، فکر کردم: آیا می‌توانیم فصل ۸ را از دیدگاه علم داده نگاه کنیم؟ یعنی، آیا می‌توانیم به صورت عینی نشان دهیم که نوشتار واقعا بد بود، جدا از نظرات خود بینندگان در مورد فصل؟ خب، بذار ببینم. اول، این ابزاری است که ما از آن استفاده خواهیم کرد:

ابزارها:

ابزار نوت‌بوک‌های جوپیتر، جایی که همه کدها در آن هستند.
ابزار Pandas and numpy، بسته پایتون برای دستکاری فریم‌های داده و توابع ریاضی
ابزار Textstat، یک بسته پایتون دیگر برای تجزیه و تحلیل متن
ابزار Datawrapper، یک وبسایت برای ایجاد تجسم‌ها
مجموعه داده‌ها: این داستان از داده‌های زیر استفاده می‌کند: https://www.kaggle.com/albenft/game-of-thrones-script-all-seasons

و در اینجا چند سوال اساسی برای هدایت تحلیل ما وجود دارد:

سوالات:

آیا فیلمنامه فصل ۸ GoT نسبت کمتری از کلمات منحصر به فرد دارد؟ کلمات منحصر به فرد برای اندازه‌گیری پیچیدگی یک متن مورد استفاده قرار می‌گیرند: هر چه نسبت آن‌ها بیشتر باشد، یک متن پیچیده‌تر خواهد بود.
آیا فصل ۸ GoT کلمات پیچیده کمتری دارد؟ کلمات پیچیده در تعریف ما کلماتی بیش از ۷ کاراکتر خواهند بود.
آیا فصل ۸ GoT کلمات «آسانی» دارد؟ در این زمینه، کلمات آسان کم‌تر از ۵ کاراکتر دارند.
آیا فصل ۸ GoT جملات پیچیده کمتری دارد؟ بیایید جملات پیچیده را تعریف کنیم تا جملات با حداقل ۱۵ کلمه باشند.
سطح نمره فیلمنامه فصل ۸ GoT چقدر است؟ این معیار که سطح پایه Flesch-Kincaid نامیده می‌شود به این اشاره دارد که آیا دانش‌آموز یک کلاس خاص می‌تواند یک متن را بخواند، و در محدوده ۱ تا ۱۲ قرار دارد.
نمره خوانایی چطور؟ برای این داستان، ما از امتیاز سهولت خواندن فلیچ استفاده خواهیم کرد، که به این اشاره دارد که درک یک متن انگلیسی چقدر دشوار است.

امتیاز کلمات منحصر به فرد

بنابراین، بیایید شروع کنیم. من تصمیم گرفتم درصد کلمات منحصر به فرد را برای هر قسمت از دو فصل، ۱ و ۸ مقایسه کنم. این بدان دلیل است که فصل ۱ نسبتا دارای امتیاز بالایی است و هر گونه تفاوت بین این دو، ما را متمایل به این باور می‌کند که نوشتار فصل ۸ در واقع بدتر است. پس از تجزیه متن برای هر قسمت، من داده‌ها را تمیز کردم و به منظور تولید نسبت کلمات منحصر به فرد برای هر کدام از آن‌ها، آن‌ها را به صورت توکن در آوردم. در زیر می‌توانید یک تصویرسازی Datawrapper را با محور افقی ببینید که تعداد فصل و اپیزود مربوطه را نشان می‌دهد.

با کمال تعجب، حداقل برای من، قسمت ۴ از فصل هشتم در این دسته بسیار بالا است. عنوان آن «آخرین استارک» است و بعد از نبرد علیه ارتش مردگان اتفاق می‌افتد. یک دلیل برای درصد کلمات منحصر به فرد آن ممکن است این باشد که این قسمت در مورد خطوط طرح چندگانه بحث می‌کند.

از سوی دیگر، پایین‌تر، دومین قسمت فصل هشتم با عنوان «شوالیه هفت پادشاهی» است و درست قبل از نبرد با مردگان رخ می‌دهد. یکی از دلایل پایین بودن امتیاز کلمات منحصر به فرد ممکن است این باشد که صحنه به طور کامل در یک مکان تنظیم شده‌است و کاراکترها تنها برای یک رویداد آماده می‌شوند، که منجر به استفاده از کلمات تقریبا مشابه به آن‌ها می‌شود. با این حال، چیزی که کمی غیر منتظره است این واقعیت است که به نظر نمی‌رسد تفاوت زیادی در امتیاز منحصر به فرد بودن در طول دو فصل وجود داشته باشد. با وجود این واقعیت که بسیاری از مردم احساس می‌کردند کیفیت این مجموعه کاهش‌یافته است، به نظر نمی‌رسد که این موضوع در این معیار منعکس شده‌باشد.

شکل ۲. درصد کلمات منحصر به فرد فصل ۱ و ۸

کلمات پیچیده

در ادامه با درصد کلمات پیچیده، من همان روش بالا را دنبال کردم، تنها یک «شرط» برای بررسی کلمات طولانی‌تر اضافه کردم. و در زیر نتایج آن آورده شده‌است. چیزی که به نظر من می‌رسد نسبت قابل توجه پایین کلمات پیچیده در قسمت 3، در فصل 8 است. این قسمت تحت عنوان «شب بلند» نام گذاری شده بود و ارتش زنده در حال جنگ با مردگان را دنبال می‌کرد. بنابراین، منطقی به نظر می‌رسد که کلمات پیچیده زیادی وجود ندارند، چون این قسمت تحت سلطه صحنه‌های مبارزه بود. اپیزودهای دیگر، هم از فصل ۱ و هم از فصل ۸، به طور کلی درصد مشابهی از کلمات پیچیده دارند که بین ۳.۰۲ و ۴.۴۱ نوسان می‌کنند.

کلمات «آسان»

اکنون، بیایید به کلمات آسان (کوتاه‌تر از ۵ کاراکتر) نگاه کنیم. به طور مشابه با کلمات پیچیده، من فقط نیاز داشتم که یک «شرط» برای اسکن کردن برای آن‌ها اضافه کنم و در اینجا نتایج وجود دارد. همانطور که می‌توانید ببینید، اپیزودها همه بخش مشابهی از این کلمات را دارند، بدون اینکه اپیزودها کلمات کم و بیش ساده‌ای داشته باشند.

جملات پیچیده

در مورد درصد جملات پیچیده چطور؟ خب، یه نگاهی به پایین بیندازیم. اول، همانطور که انتظار می‌رود قسمت ۳ فصل ۸ در این دسته نسبتا پایین است. سپس، دوم تا آخر، اپیزود ۵ از همان فصل با عنوان «زنگ‌ها» وجود دارد. این یک قسمت متمرکز بر مبارزه نیز هست، که به ما کمک می‌کند بفهمیم چرا برای این معیار پایین می‌آید. چند قسمت از فصل ۱ و ۲ نیز نمره جمله پیچیده پایینی دارند که کمی عجیب است (حداقل برای من که فکر می‌کنم فصل ۱ خیلی بهتر از هشتم بود). همچنین جالب توجه است که بیش‌ترین قسمت امتیاز دهی در این دسته، قسمت ۸ فصل ۱ توسط خود جورج آر مارتین نوشته شده بود که می‌توانست به جملات پیچیده کمک کند. در مورد تفاوت‌های کلی در دو فصل، من فکر نمی‌کنم که هیچ چیزی برای این معیار وجود داشته باشد. تو چی فکر می‌کنی؟

شاخص سهولت در خواندن

خواندن کدام متن اپیزودها آسان‌تر یا سخت‌تر است؟ قسمت دوم فصل یک امتیاز بالاتر از ۹۰ را دریافت می‌کند و به «بسیار آسان» ترجمه می‌شود، در حالی که قسمت‌های بین ۸۰ تا ۸۹ طبق معیار فلیش «آسان» خوانده می‌شوند. همانطور که می‌بینید، خواندن تنها دو قسمت سخت‌تر است: فصل ۱ قسمت ۷ که «کاملا آسان» و فصل ۱ قسمت ۸ که «استاندارد» است. باز هم، این واقعیت که جورج آر. مارتین مارتین آن را نوشته است شاید در سخت‌تر خواندن آن نقش داشته باشد. گام‌های بعدی برای این بخش می‌تواند جمع‌آوری میانگین این معیار برای نمایش‌های تلویزیونی باشد، به خصوص از آنجا که شاخص سهولت خواندن معمولا به متون نوشتاری اشاره دارد که پیچیده‌تر از متون گفتاری هستند.

سطح امتیاز

حال بیایید نگاهی به سطح نمرات برای تمام قسمت‌های فصل ۱ و ۸ بیندازیم. همانطور که می‌توانید ببینید، قسمت‌های ۷ و ۸ فصل که خواندن آن‌ها سخت‌تر بود (بالا) نیز با سطح امتیاز بالاتر مطابقت دارد. علاوه بر این، نقاط اعشاری تا امتیاز پایین‌تر گرد می‌شوند (برای مثال ۶.۲ به ۶). قسمت دیگر از ۴.۵ تا ۶.۵ است که به استثنای قسمت ۲ فصل ۱ که سطح خواندن آن ۳ (یا رتبه سوم) است. مانند بالا، جالب خواهد بود که ببینیم آیا برخی از انواع متوسط در سراسر برنامه‌های تلویزیونی را می‌توان گردآوری کرد تا ببینیم گیم آو ترونز چگونه رده‌بندی می‌شود.

تعمیم به همه فصل‌ها

حالا که ما به همه معیارها نگاه کردیم، چطور می‌توانیم بررسی کنیم که هر فصل در آن‌ها چگونه عمل می‌کند؟ در زیر می‌توانید یک طرح خطی با تعداد فصول در محور افقی پیدا کنید. جالب توجه است که یک جهش در پیچیدگی جملات در فصل ۶ وجود دارد، اما معیار تا حد زیادی در طول فصول مشابه باقی می‌ماند.

نتیجه‌گیری

برای جمع‌بندی یافته‌هایمان، من قطعا تعجب کردم که فصل ۸ برای معیارهایی که ما استفاده کردیم بدتر از فصل ۱ نبود. در مقابل، متون اپیزودهای این فصل نتایج مشابهی در کلمات منحصر به فرد، کلمات پیچیده و آسان، جملات پیچیده و سهولت معیارهای خواندن به دست آوردند. این می‌تواند نشان دهد که نارضایتی مردم از این مجموعه بیشتر در خطوط طرح و نحوه برخورد آن‌ها است به جای خود اجزای متنی.

با تشکر برای خواندن این مقاله!

این متن با استفاده از ربات ترجمه مقالات دیتاساینس ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.

مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.