این چک لیست ترجمه و خلاصه دم دستی از چک لیست پروژه دیتاساینس و ماشین لرنینگ سایت دیتاکمپ هست که می تونید اینفوگرافیک اونو به زبان انگلیسی از این لینک دانلود کنید.
خوبیش اینه که این چک لیست ترکیبی از فرآیندهای تیم دیتاساینس مایکروسافت و دومینو دیتا لب هست و میشه بهش اعتماد کرد.
آپدیت: واقعیت اینه که تو بحث های تخصصی ترجمه واقعا کار آسونی نیست و من هم هیچ ادعایی تو ترجمه ندارم ولی به نظرم رسید اگر ترجمه بشه می تونه کمک کننده باشه. امیدوارم براتون مفید باشه به درد من که خیلی خورد.
به طور کلی پروژه های دیتا ساینسی موفق خواهند بود که قواعد زیر را رعایت می کنند
با اینحال تیم های داده ساسنس علاوه بر موارد بالا باید قواعد زیر را نیز رعایت کنند
هر دو سازمان مایکروسافت و دومینو دیتا لب از شیوه های زیر برای فاز بندی پروژه های دیتاساینس خودشون استفاده می کنند
- باید به صورت کاملا شفاف دغدغه های بیزیسن و دلیل ایجاد پروژه مشخص گردد
- نقش افرادی که در پروژه حضور دارند و وظایف و اختیارات هر فرد را مشخص کنید مثل لید دیتاساینس- حسابدار-مدیر داده ها- مهندس داده و ...
- نتایج کلیدی پروژه های قبلی چه بود؟
- چه بخش هایی از پروژه های قبلی را می توانیم در این پروژه استفاده کنیم؟
- چه اشتباهاتی انجام دادید که باید از آن اجتناب کنید؟
قدم ۴: معیارهای شاخص عملکردی - KPI ها را برای اندازه گیری میزان موفقیت تعیین نمایید
- معیارهای KPI باید طبق متد SMART مشخص گردند
- شاخص Specific: مشخص باشد به طوری که تمام افراد تیم آن را بفهمند.
- شاخص Measurable: قابل اندازه گیری باشد به طوری بتوانیم به سادگی با دیدن عدد بفهمیم به KPI رسیدیم یا خیر
- شاخص Achievable: اعضای تیم توانایی و منابع لازم برای رسیدن به هدف را داشته باشند
- شاخص Relevant: شاخص ها در راستانی اهداف سازمان و شرکت باشند
- شاخص Time-Related: ددلاینی برای رسیدن به هدف مشخص گردد
یک مثال از KPI غیر SMART: 'افزایش بازدید سایت'
یک مثال از SMART KPI: بهینه سازی UI و UX وبسایت برای افزایش ۱۰٪ نرخ تبدیل فروش تا پایان تابستان
قدم ۵: اختیارات و انتظارات پروژه را مشخص کنید
- خروجی های پروژه چه مواردی باید باشد؟
- چه آیتم هایی برای رسیدن به خروجی مد نظر مورد نیاز است؟
- چه مواردی در پروژه گنجانده نمی گردد و شامل پروژه نخواهد شد؟
قدم ۶: یک پلن برنامه ریزی برای پروژه بنویسد
- نقاط عطف را برای مراحل میانی پروژه تعیین نمایید
- ددلاین ها را برای هرکدام از نقاط عطف پروژه تعیین کنید
- شرح کوتاهی از هر مرحله و خروجی مدنظر آن بنویسید
قدم ۷: تخمین تاثیرگذاری های پروژه
- تعیین کنید اگر به اهداف دست پیدا کنید سازمان چقدر سود خواهد نمود
- اگر عدم قطعیت در محاسبات وجود دارد یک محدوده برای آن مشخص نمایید
- هرگونه مزیتی شرکت به دست خواهد آورد ولی به صورت کمی قابل اندازه گیری نیست را ذکر نمایید
قدم ۸: هزینه های پروژه را تخمین بزنید
- پروژه چه هزینه هایی خواهد داشت؟
- چقدر زمان باید صرف انجام پروژه گردد؟
- چه منابعی برای انجام پروژه نیاز دارید؟
قدم ۹: ریسک های پروژه را تخمین بزنید
- تمام ریسک های پروژه را ذکر کنید
- برای هر کدام از ریسک ها- تاثیر آن را به صورت احتمال وقوع ضربدر شدت وقوع آن محاسبه نمایید.
قدم ۱۰: تصمیم بگیرید می خواهید پروژه را ادامه دهید یا خیر
با توجه به انتظارات پروژه- تاثیرات و ریسک های آن یکی از تصمیم های زیر را بگیرید
- پروژه را در دستور کار قرار دهید و شروع کنید
- پروژه را به صورت Hold نگه دارید و بعد از انجام اولیت های بالاتر به آن سر بزنید
- پروژه را به طور کل کنسل کنید
قدم ۱۱: مسولیت های هر شخص را در تیم مشخص کنید
می توانید از مدل RACI استفاده کنید - برای مثال برای هر تسک موارد زیر را مشخص کنید:
- تعیین Responsible: مشخص کردن فرد مسیول انجام تسک است
- تعیین Accountable: مشخص کردن فردی که مسیول اتخاذ تصمیم های کلیدی است
- تعیین Consulted: مشخص کردن افرادی که که نظراتشان در مورد تصمیمات کلیدی خواسته شده است
- تعیین Informed: مشخص کردن افرادی که در مورد تصمیمات کلیدی باید آگاه شوند
قدم ۱۲: تعیین کنید چطور قرار است با هم در ارتباط باشید؟
- چگونه و از چه طریقی با هم در ارتباط خواهید بود؟
- جلسات به چه صورت برگزار خواهد شد؟
قدم ۱۳: دیتا سورس ها را مشخص کنید
-آیا به این دیتاسورس دسترسی دارید؟
قدم ۱۴: از نظر قانونی موارد مورد نظر را بررسی کنید
قدم ۱۵: نوع تکنولوژی که می خواهید استفاده کنید را مشخص کنید
قدم ۱۶: چارت پروژه را طراحی کنید
قدم ۱: به دیتاساینتیست ها دسترسی به تمام دیتاست ها داده شود
قدم ۲: دیتاها را منتقل کنید
قدم ۳: دیتاها را تحلیل کنید
قدم ۴: شاخص های کلیدی عملکردی (KPI) ها را برای اندازه گیری میزان موفقیت مشخص کنید
برای هر دیتاست:
قدم ۵: تصمیم بگیرید پروژه را ادامه دهید یا خیر
با توجه به گزارش کیفیت داده ها یکی از تصمیم های زیر را بگیرید
قدم ۶: یک پایپ لاین برای داده ها ایجاد کنید
داده ها باید با پیشرفت پروژه به صورت منظم بروز گردند. پایپ لاین داده باید:
قدم ۷: پایپ لاین داده خود را داکیومنت کنید
نکته: این فاز هر پروژه های ماشین لرنینگ هم آزمایش هایی که می خواهیم در پروژه انجام دهیم (مثل A/B تستینگ) را شامل می گردد. از هر مرحله ای که برای پروژه شما منطقی نیست گذر کنید.
قدم ۱: یک فرضیه را در نظر بگیرید
قدم ۲: داده های خود را به دو بخش Train و Test تقسیم کنید
قدم ۳: مهندسی ویژگی ها - Data Features
برای مدل خود از طریق تکنیک های زیر Feature ایجاد کنید
قدم ۴: مدل را fit کنید یا آزمایشی را بر روی آن انجام دهید
قدم۵: نتایج را ارزیابی کنید
از معیارهایی مثل دقت-Accuracy | درستی-Precision و Recall برای ارزیابی مدل خود استفاده کنید. اگر عملکرد به اندازه کافی خوب بود:
قدم۶: گزارشی از نتایج آماده کنید
قدم ۱: یک شرایط آزمایشی را ایجاد نمایید
یک شرایط آزمایشی ایجاد کنید به صورت اتوماتیک عملکرد مدل یا آزمایش شما را تست کند و اشکالاتی که ممکن است دوباره تکرار شوند را مشخص کند. این موارد شامل حالت های زیر می شود:
قدم ۲: تاثیری که بر روی کسب و کار شامل می شود را مجدد بررسی کنید
حالا شما عملکرد مدل خود را به صورت یک معیار دارید و می توانید به صورت عملی تاثیراتی را که انتظار داشتید بر روی بیزینس چک کنید. در مورد تاثیرات با اعضای کلیدی بیزینس بحث و مکالمه کنید
قدم ۳: رویکرد فنی که اتخاذ کردید را مجدد بررسی کنید
مطمین شوید که مدل نهایی از لحاظ تکنیکالی مناسب است
قدم ۴: قابلیت استقرار یا Deploy را با تیم فنی بررسی و تایید کنید
قدم ۵: نگهداری نتایج null
هرچیزی که به مرحله Production نمیرسد باید در یک مخزن دانش - Knowledge Repository نگهداری شود تا پروژه های آینده برای آن وقت صرف نکنند.
قدم ۱: یک پایپ لاین دیتا توسعه دهید
قدم ۲: یک پایپ لاین برای مدل توسعه دهید
قدم ۳: برای مانیتور اطلاعات برنامه ریزی کنید
قدم ۴: یک سناریو A/B تستینگ ایجاد کنید
قدم ۵: نتایج A/B تستینگ را تحلیل و گزارش نمایید
قدم ۶: نتایج را برای تمام کاربران یا بیشتر آنها امتحان نمایید
اگر تست ها موفقیت آمیز بود feature یا مدل خود را برای تمام کاربران یا بیشتر آنها امتحان نمایید.
قدم اول: یک گزارش از خروجی کار بنویسید
به صورت خلاصه وضعیت پروژه و مواردی که یاد گرفتید یا مشخص کنید
قدم دوم: گرفتن فیدبک از مشتریان
قدم ۱: یک پایپ لاین برای مانیتور توسعه دهید
یک پایپ لاین برای track کردن خودکار عملکرد و معیارهای Safety برای پلن مانیتورینگ خودتون تعریف کنید
قدم ۲: داشبورد ایجاد کنید
داشبوردهایی ایجاد کنید تا تغییرات متریک هارو در هر زمانی نشان دهند
قدم ۳: alert ها را تنظیم کنید
مشخص کنید که از طریق ایمیل - پیامک - ربات و ... تغییرات غیرقابل پذیرش را به شما اعلام نماید.