دانشجوی مادام العمر??، دلباختهی هوش مصنوعی ?
کتابهای پرفروش اما نخوانده شده
تا حالا شده کتابی بخرید ولی تا آخر نخونید؟ به نظرتون چقدر از مردم این کار رو میکنن؟ چقدر از کتاب ها تا آخر خونده میشن؟
این مقاله میخواد بررسی کنه که چقدر از کتابها تا آخر خونده میشن. برای این کار از دادههای در دسترس که در سایت طاقچه بود استفاده شده. طاقچه یه پلتفرم خرید کتاب الکترونیکی هستش. خیلی خوب میشد اگه بفهمیم هر کی آخرین بوکمارکش در کتاب کجا بوده، اون وقت به راحتی میشد بررسی کرد که چقدر از کتاب ها خونده میشن. ولی متاسفانه این داده محرمانه است و باید جور دیگری این رو حدس زد.
بریدهها
بخشی در این سایت هست به نام «بریدهها» که افراد میتونند قسمتی از کتاب که براشون جالب بوده رو به اشتراک بذارن. مثلا جملهای از کتاب که خوششون اومده رو انتخاب میکنن و دربارهاش حرف میزنن و افراد دیگه میتونن اون رو لایک کنن یا کامنت بذارن. (به عبارت دیگه، توئیتر رو در نظر بگیرید که میشه هر قسمت از کتاب رو کوت کرد تا بقیه هم ببیند.) مثلا در تصویر زیر، یه بریده از کتاب «فارسی شکر است» رو میبینید.
خوب چون این بخش برای نویسنده این مطلب جذاب بوده به اشتراک گذاشته و مهمتر این که این بخش از اول کتاب برداشته شده (البته کل کتاب همش چند صفحه است!).
این خیلی مهمه که این بریدهها از کدوم بخش کتاب انتخاب و به اشتراک گذاشته میشن.
جمعآوری دادهها
در این مقاله لیست کتابهای پرفروش چند سال گذشته در طاقچه استخراج شد و برای هر کتاب، بریدههای اونها هم جمعآوری شد تا به این سوال برسیم که چقدر از کتابهای پرفروش خوانده شده. بخشی از کتابها در تصویر زیر هست. همچنین میتونین این لیست رو به همراه کدی که بریده کتابها رو استخراج میکنه از گیتهاب دانلود کنید.
فرض مهم در این مقاله
این مقاله برای ادامه یه فرضیه در نظر میگیره: فرض کنیم که قلم هر نویسندهای تا آخر کتابش عوض نمیشه و تمام کتاب رو با یک جذابیت مینویسه. پس اگر فردی، بخشی از اول کتاب براش جذاب بوده و به اشتراک گذاشته، تا آخر کتاب هم احتمالا بخشهایی رو دوست خواهد داشت و به اشتراک خواهد گذاشت مگر اینکه کتاب رو تا آخر نخونده باشه.
مثال مهم از فرضه بالا: چون فرض میکنیم که تمام کتاب با یک گیرایی و جذابیت نوشته شده باشه و اگر تا آخر کتاب رو بخونم، به احتمال زیاد از هر بخش کتاب، بریدهای به اشتراک میگذارم. اگه از اول کتاب، جملهای به اشتراک گذاشتم ولی از آخر کتاب چیزی به اشتراک نذاشتم، احتمالا آخر کتاب رو نخوندم.
پراکندگی دادهها
چند نمودار زیر، پراکندگی بریدهی کتابها رو نشون میده که بیشتر از کدوم بخش کتاب به اشتراک گذاشته شدند. تصویر زیر بریدههای کتاب «کمونیسم رفت، ما ماندیم و خندیدیم» رو نشون میده، میبینید که ابتدا اشتراک گذاری کتاب رو افزایش بوده و سپش کاهش و سپس افزایش که به بالاترین حد خودش رسیده. (میشه حدس زد که افراد، کدوم بخشهای کتاب رو بیشتر دوست داشتند.)
در سایت طاقچه، بریدهها با متغیری به نام Chapter نشانه گذاری شده اند و با شماره صفحات کتاب، شماره گذاری نمیشوند.
اما کتاب زیر پراکندگی بریدههای کتاب صفر به یک رو نشون میده. (کتابی معرکه دربارهی تبدیل ایده به یک استارتاپ موفق و پایدار از پیتر تیل، هم بنیانگذار پیپال). این کتاب از پرفروشهای طاقچه بوده ولی نگاهی به نمودار زیر بندازید. این نمودار نشون میده که بخش خیلی زیادی از بریدهها، از ابتداییترین صفحات کتاب بوده و میشه حدس زد که بیشتر افراد کتاب رو ناتموم رها کردند و اواخر کتاب رو دوست نداشتند.
لیست کتابهای خوانده شده و نخوانده شده
با توجه به فرضیه این مقاله، لیست زیر از بین پرفروشترین کتابهای طاقچه ساخته شده که بیشترین و کمترین کتابهای خونده شده رو نشون میده.
این لیستها بر اساس دادههای قابل دسترس در سایت طاقچه و همچنین فرضیات این مقاله ساخته شده و برای ساخت لیست کاملا دقیق به بوکمارکهای کاربران طاقچه نیاز است که این دادهها محرمانه و غیرقابل دسترس هستند.
حرف آخر
با دادههای جمعآوری شده از سایت میشه کارهای خیلی بیشتری کرد که در مقالهی آینده بررسی میکنیم. اگه این مطلب رو دوست داشتید یه ❤️️ برامون بذارید و نظراتتون رو بنویسید.
همچنین برای نحوهی جمعآوری دادههای سایتها این مطلب رو ببینید.
مطلبی دیگر از این انتشارات
خلاصه کتاب: آشغالدونی- غلامحسین ساعدی
مطلبی دیگر از این انتشارات
خلاصه کتاب: اسب ها، اسب ها از کنار یکدیگر- محمود دولت آبادی
مطلبی دیگر از این انتشارات
کتابی جدید همراه با چند شگفتانه