ویرگول
ورودثبت نام
هادی صفری
هادی صفری
خواندن ۲ دقیقه·۴ سال پیش

نگاهی آماری به مقالات سایت DBLP

همکاری محققان علوم کامپیوتر در نگارش نوشته‌های علمی و دانشگاهی در طول زمان تغییر کرده است. برای بررسی دقیق‌تر این تغییرات به سراغ داده‌های سایت کتابشناسی DBLP رفته‌ایم و تحلیلی کوتاه انجام داده‌ایم.

سایت DBLP که در ابتدا مخفف DataBase systems and Logic Programming بوده است امروزه به یک سایت جامع کتابشناسی برای نشریات علوم کامپیوتر تبدیل شده است و مقالات منتشرشده در مهم‌ترین نشریات و گردهمایی‌های مرتبط با این حوزه را فهرست می‌کند. این سایت در سال ۱۹۹۳ در دانشگاه تری‌یر آلمان راه‌اندازی شده است.

سایت DBLP
سایت DBLP

مجموعه‌دادهٔ این سایت در آدرس https://dblp.org/xml در دسترس است و می‌تواند برای تحلیل‌ها مورد استفاده قرار گیرد. در این تحلیل از انتشار ۲۰۱۹/۱۲/۰۲ داده‌های سایت استفاده می‌شود. تحلیل‌ها به منتشراتی که به عنوان «مقاله» (article) یا «منتشرشده در گردهمایی‌های ادواری» (proceedings) برچسب خورده‌اند محدود شده است. پس از تمیز کردن مجموعه‌داده، ۴٬۶۵۸٬۵۱۸ رکورد داده باقی می‌ماند که در ادامه مورد بررسی قرار می‌گیرد.

منتشرات مورد بررسی در سال‌های ۱۹۳۶ تا ۲۰۲۰ انتشار یافته‌اند. داده‌های سال‌های ۲۰۲۰ و ۲۰۱۹ در زمان بررسی به بلوغ کافی نرسیده بوده‌اند و قابل استناد نیستند.

سال انتشار

تعداد نوشته‌های منتشرشده از دههٔ ۱۹۵۰ تا کنون رشدی تقریباً نمایی داشته است.

نوشته‌های منتشرشده بر اساس سال انتشار
نوشته‌های منتشرشده بر اساس سال انتشار
نوشته‌های منتشرشده بر اساس سال انتشار (محور لگاریتمی)
نوشته‌های منتشرشده بر اساس سال انتشار (محور لگاریتمی)

تعداد نویسندگان

تعداد نویسندگان مقالات، همانند بسیاری از پدیده‌های مشابه، توزیعی شیبه به توزیع دم‌سنگین دارد.

نوشته‌های منتشرشده بر اساس تعداد نویسندگان
نوشته‌های منتشرشده بر اساس تعداد نویسندگان
نوشته‌های منتشرشده بر اساس تعداد نویسندگان (محور لگاریتمی)
نوشته‌های منتشرشده بر اساس تعداد نویسندگان (محور لگاریتمی)

اکثر مقالات ثبت‌شده دو نویسنده داشته‌اند. مقالاتی با سه نویسنده در جایگاه بعدی قرار دارند. پس از آن، مقالاتی با چهار نویسنده و با اختلافی اندکی مقالاتی با تنها یک نویسنده قرار می‌گیرد.

نوشته‌های منتشرشده بر اساس تعداد نویسندگان (مقادیری با دست‌کم ۱۰٬۰۰۰ مقاله)
نوشته‌های منتشرشده بر اساس تعداد نویسندگان (مقادیری با دست‌کم ۱۰٬۰۰۰ مقاله)

روند تغییر تعداد نویسندگان در گذر زمان

به نظر می‌رسد در سال‌های اخیر تمایل نویسندگان به همکاری بیشتر شده است. در گذشته اکثر نوشته‌ها تنها یک نگارنده داشته‌اند. در اوایل دههٔ ۱۹۹۰ مقالاتی با دو نویسنده بیشتر از کارهای تک‌نویسنده‌ای می‌شود. در اوایل دههٔ ۲۰۱۰ تعداد نوشته‌های دارای سه نویسنده از نوشته‌هایی که دو نویسنده دارند پیشی می‌گیرد.

تعداد نویسندگان در گذر زمان
تعداد نویسندگان در گذر زمان

با نرمال‌سازی با توجه به تعداد کل نوشته‌های منتشرشده در هر حال سال، تغییرات واضح‌تر می‌شود.

تعداد نویسندگان در گذر زمان (نرمال‌شده)
تعداد نویسندگان در گذر زمان (نرمال‌شده)

به نظر می‌رسد علاقه به تنها کار کردن روندی کاهشی داشته است. علاقه به تحقیقات دونفری روندی افزایشی داشته است که در اواسط دههٔ ۱۹۹۰ به اوج خود می‌رسد و پس از آن سقوط می‌کند. علاقه به نگارش سه‌نفری منتشرات علمی با شیبی آرام افزایش می‌یابد و پس از رسیدن به اوج خود در ابتدای دههٔ ۲۰۱۰، روندی نزولی در پیش می‌گیرد. در سال‌های اخیر نگارش مقالات علمی در گروه‌های بزرگ‌تر رایج‌تر شده است.

هرساله بیش از ۳۰۰٬۰۰۰ مقاله در حوزهٔ علوم کامپیوتر در مجلات و گردهمایی‌های معتبر منتشر و در سایت DBLP فهرست می‌شود.

کدها، ابزارها و افق پیش رو

کدهای مورد استفاده برای تمیز کردن داده‌ها و تلاش‌هایی برای پیش‌بینی روند تغییرات در مخزن گیت‌هاب https://github.com/hadisfr/dblp-collaboration-trends قابل دسترسی است.

تحلیل‌های کامل‌تر و بررسی تأثیر همه‌گیری جهانی ویروس کرونا،قرنطینه و مجازی شدن بسیاری از فعالیت‌های دانشگاهی بر این روند نیز ممکن است نتایج جالب توجهی داشته باشد.


dblpمقالات دانشگاهینویسنده همکارعلوم کامپیوتر
تحلیل‌گر شبکه‌های اجتماعی | کارشناسی ارشد مهندسی نرم‌افزار دانشگاه تهران | دانشجوی دکتری سیاست‌گذاری علم و فناوری دانشگاه تربیت مدرس | hadisafari.ir
شاید از این پست‌ها خوشتان بیاید