محاسبه آمار حقیقی مبتلایان کرونا در کشور

ایام قرنطینه در کنار حس کسالت آوری که به ادم میده میتونه ذهن رو هم فعالتر کنه. هر روز مثل خیلی از افراد یه سری به سایت https://www.worldometers.info/coronavirus/ میزنم و آمار کشور ها رو میبینم . حقیقتا الان خیلی از درس های آمار و احتمال مهندسی و حتی شبکه های عصبی دوره دانشگاه خاطرم نیست . و از آخرین کورس دیتاماینینگی که مشاهده کردم شاید ۲ سال بگذره. اما خوب برخی مفاهیم همچنان در ذهنم فعالن . برونیابی . نمودار زنگوله ای و ... . نمودار امار مبتلایان در ایران به شدت عجیب بود . تا این حد که بسیاری از دوستانم که الان درکار تحلیل داده هستند فرضیه عدد سازی رو مطرح کردن . اما به نظر من عدد سازی ای وجود نداشته و نتایج گفته شده همانند گفته های سخنگوی وزارت بهداشت بر اساس داده های قطعی آزمایشگاهیه . اما مشکل کار کجاست؟ بله خود آزمایشگاه. داده ها قطعی هستند اما ازمایشگاه ها کافی نبوده و نیستند. حتی در امریکا هم با وجود تست های میلیونی که اکنون گرفته می شود در بازه ای نمودار حالت درستی ندارد . و این دقیقا آنجاست که تعداد مبتلایان بیش از ظرفیت ازمایشگاه شده اند .

همین ایده باعث شد که چند فرض را که مبتنی بر اخبار روزهای اخیر هست رو در نظر بگیرم .

  • فرض صفر: با توجه به کمبود تست ها و پروتکل های درمانی تست غالبا از افراد با علایم متوسط و شدید گرفته می شده است .
  • فرض اول : داده هایی که بعد از تاریخ ۱۱ فرورین وجود دارند . با توجه به کاهش نسبی و افزایش ظرفیت آزمایشگاهی قابل اعتماد تلقی میشوند
  • فرض دوم : داده های قبل از ۱۱ فروردین با توجه به اینکه ماکزیمم ظرفیت آزمایشگاهی این بوده است . ناقص هستند .
  • فرض سوم : پیک بیماری نه در ۱۱ فروردین بلکه در روزهای قبل اتفاق افتاده است .
  • فرض چهارم : با توجه به داده های کشورهای پیشرفته و پیشگام در تست و غربالگری هر هفته در دوران شیوع تا رسیدن به پیک آمار مبتلایان ۲ برابر شده است .

با توجه به مفروضات بالا معادله نمایی در روزهای بعد از ۱۱ فروردین به دست می آید :

از این نمودار برای برونیابی داده های قبل از ۱۱ فروردین با فرض اینکه پیک بیماری در اواسط اسفند رخ داده با شده باشد استفاده می شود . روزهای شروع همه گیری اواخر هم احتمالا اواخربهمن بوده است که می توان تصور کرد چند صد مبتلا وجود داشته اند. ( طی مصاحبه های متعدد گفته شده است اواخر بهمن بیماری در کشور وجود داشته است اما به دلیل عدم تست شناسایی نشده بود . )

نتایج کامل در این لینک و به صورت stylesheet موجود است :

https://docs.google.com/spreadsheets/d/11Lr13TCFM209lJtHXYXZQJ5ufww531TIJ_H4U-Xlpp0/edit#gid=0

تحیل نتایج:

  • جمع مبتلایان با علایم متوسط و شدید تا قبل از ۲۷ فروردین تخمین زده می شود که ۲۶۰۰۰۰ نفر باشد.
  • با توجه به یافته های جهانی ۸۰ درصد افراد علایم خفیفی دارند که احتمالا از آن ها تستی گرفته نشده است . لذا شمار مبتلایان حقیقی نزدیک به یک میلیون سیصد هزار نفر خواهد بود.
  • با توجه به امار مرگ و میر یک درصدی که سازمانی بهداشت جهانی اعلام کرده است . رقم متوفیان ۱۳۰۰۰ نفر پیش بینی می شود. این رقم به اذهان نزدیک است. چرا که در روزهای ابتدایی افراد بسیاری بدون اینکه تستی از انها گرفته شده باشد فوت کرده اند. و بعد از تغییر پروتکل های اعلام علت فوت رقم فوتی ها دقیق تر شده است .
  • با حفظ همین شرایط تا ۴۰ روز آینده به رقم مبتلای جدید ۱۳۰۰۰۰ نفر افزوده می شود. اما احتمالا ۲۰ درصد افراد مورد ازمایش قرار گیرند لذا ۲۶ هزار نفر را می توان در امار رسمی متصور بود.


تایید اعتبار:

  • گزارش پژوهش های مجلس اعلام کرده است که نزدیک به ۸۰۰۰۰۰ نفر مبتلاشده اند. این آمار تا حدی به آمار محاسبه شده بنده نزدیک است .
  • در ۲۷ فروردین (۱۵ اوریل ) تعداد مبتلایان از طرف وزرات بهداشت ۱۵۱۲ اعلام شده است که محاسبات نشان می داد باید ۱۵۰۲ باشد.

ذکر چند نکته:

  • در ابتدا از زحمات کادر درمانی بسیار باید تشکر کرد و باید گفت حتی در کشورهای بسیار پیشرفته هم در برخی روزها به علت تعداد بالای بیماران انحراف از روند طبیعی رفتار داده ها مشاهده می شود . در امریکا تخمین زده ام که چیزی در حدود ۳ میلیون نفر مبتلای واقعی هستند.
  • این داده ها تابع رفتار افراد و سیاست ها هستند . درصورتی که اتفاق خاصی رخ ندهد روند همین است. اما اگر مراقب کم شود و یا احیانا تشدید شود ما شاهد تغییر خواهیم بود .