ویرگول
ورودثبت نام
ایمان محدثی
ایمان محدثی
ایمان محدثی
ایمان محدثی
خواندن ۱ دقیقه·۳ ساعت پیش

یک چالش واقعی از دنیای علم داده‌ها رو دارم لطفا وارد این چالش بشید:

از سال 1939، United States Bureau of Labor Statistics  به‌صورت ماهانه وضعیت اشتغال را پایش می‌کند.
فرض کنید تعداد کارفرمایان حوزه ساخت ‌وساز بین سال‌های 1939 تا 2019 را در اختیار دارید و در نمودار روند، ناگهان با یک جهش غیرعادی روبه‌رو می‌شوید مانند تصویر پست:
حالا سؤال اینجاست:
1-  آیا این نقطه می‌تواند یک داده پرت (Outlier) باشد که به‌طور معناداری از روند کلی فاصله گرفته است؟
اگر بله، بر چه اساسی این تشخیص را می‌دهید؟
2- اگر مشخص شود این مقدار بازتاب‌دهنده عدد واقعی اشتغال نیست (مثلاً خطای ثبت داده)، چه تصمیمی می‌گیرید؟
اگر شما تحلیل‌گر این پروژه بودید، چه رویکردی انتخاب می‌کردید و چرا؟
بیایید تجربه‌ها و نگاه‌های متفاوت را با هم به اشتراک بگذاریم
پاسخ خودتون را با ذکر روش تحلیلی‌تان به اشتراک بگذارید لطفا.

علم دادهتحلیل دادهدیتا ساینسداده کاوی
۱
۰
ایمان محدثی
ایمان محدثی
شاید از این پست‌ها خوشتان بیاید