خب یادتونه خیلی درگیر مسیله روش تحلیل داده ام را چیکار کنم بودم ....
به یه سری نتیجه رسیدم....
گام اول : تصحیح دیتای موجود.
گام دوم: نوشتن گزارش از مجموعه اتفاقات و تعیین علت و معلول رویداد ها به مدت حداقل سه ماه + تصحیح دیتا
گام سوم: ساخت دیتا بیس آماری و تحلیل های همبستگی آماری (کشف دقیق تر علت و معلول ها)
گام چهارم: ساخت شبکه های ارتباطی و تشکیل خوشه و تحلیل خوشه ها
گام پنجم: محدود کردن شرایط محیطی و خرابی های سیستم
در این مدت سه ماه سعی کردم گام یک و دو را بردارم. حالا نوبت گام سوم یعنی تحلیل های آماری و ساخت دیتابیس بر اساس مسیله ها است.
یکی از روش های کارم اینست که تمام علت های تاثیر گذار را در سه کتگوری دسته بندی کنم. 1- محیط: تمام رویداد هایی که مربوط به شرایط محیطی است. مثلا اینکه تعطیلات آخر هفته کاربر اپلیکشن کم می شود. تعطیلات و روز کاری بودن یک علت محیطی است. 2- سیستم: تمام خرابی هایی که به خاطر خود محصول است. مثلا در یک روز اپلیکشن خراب می شود و کاربر افت می کند. 3- انسان: تمام رویداد های انسانی که منجر به افزایش یا کاهش کویری می شود. مثلا تیم سردبیری اقدامی انجام می دهند که منجر به افزایش کاربر در آن روز می شود. در قدم بعدی می خواهم روابط دو به دو یا چند به چند پارامتر ها نسبت به هم دیگر بدانم. و قدم بعد تر می خواهم بدانم هر کتگوری علت چه سهمی در تغییرات دارد.
جهت افزایش دانش آماری، کتاب آمار عملی برای دیتا ساینس ها را شروع به مطالعه کردم. تونستم خلاصه هایم را اینجا به اشتراک می گذارم.