توی ویرگول قبلیم که چگونگی تبدیل شدن به یک دیتاساینتیست جونیور بود رو توضیح دادم و گفتم که اگر از این ویرگول استقبال بشه حتما سراغ مید لول هم خواهم رفت و با توجه به اینکه توی کمتر از 12 ساعت 26 بازدید،5 لایک و 1 کامنت دریافت کرد(که این برای من واقعا ارقام باور نکردنی ای هستن چون اکثر افرادی که بازدید می کنن چون عضو سایت نیستن لایک نمیکنن(خود منم قبل از اینکه بیام ویرگول وضعم همین بود!))
تصمیم گرفتم که:
الوعده وفا!
خب! مقدمه چینی رو بذاریم کنار و بریم سراغ اصل مطلب!
توی این مرحله پروژه گرفتن و فعالیت عملی بخش انکار ناپذیر کاره و باید تا میتونید پروژه بزنید اگه وارد بازار کار بشین یا به عنوان کارآموز استخدام بشین که فبها وگرنه میتونین از سایت کگل استفاده کنید و وارد بخش دیتاست هاش یا مسابقاتش بشین و از دیتاست هاش استفاده کنید و خدا رو چه دیدین؟شاید جایزه م بردین!(البته فعلا بعید میدونم :) ! )
اما در این بخش ما بیشتر به بخش آموزشی کار داریم و من فرض رو بر این میگیرم که شما در کنار یادگیری اینها دارین پروژه هم میزنین و تو هر پروژه از مطالب جدیدی که یادگرفتین استفاده می کنین.
خب!مقدمه بسه و بریم سراغ مطالب!
همونطور که میدونید(یا شایدم ندونید!) توی صنعت بیشتر اوقات فایل هایی که یک دیتاساینتیست باهاشون سروکار داره از نوع csv یا excel نیستن و بلکه از نوع پایگاه داده هستن بنابراین شما باید دیر یا زود کوئری زدن روی پایگاه داده رو یادبگیرین.
پایگاه داده ها دو دسته هستن:
معمولا دیتاساینتیست که ترجیح میدن که از sql ها mysql و از nosql ها هم mongo db روانتخاب می کنن اما پیشنهاد من اینه که قبلش مفاهیم پایگاه داده رو بلد بشین و بعدش اینها رو یاد بگیرین و نکته ی بعدی این که حتما اتصال اینها رو به پایتون یاد بگیرین که چجوری کوئری هاتون رو تو پایتون پیاده سازی کنید(نترسین همشو میگم!)
اول بریم سراغ مفاهیم!
برای مفاهیم این آموزش فرادرس رو بهتون پیشنهاد میدم که حدودا 8 ساعت طول میکشه و توسط دکتر فرشید شیرافکن تدریس شده و بعدشم این دوره ی کوچولو تو چیستیو رو بگذرونین و این دوره.
تبریک میگم!شما به مفاهیم پایگاه داده مسلط شدین حالا نوبت کوئری زدن تو پایتونه!
فعلا همین دو تا پایگاه داده ای که گفتم رو تو پایتون پیاده کنین و بقیه ش رو برای سنیور یا ادامه مسیرتون بذارین.
برای mysql این دوره و برای mongo db این دوره پیشنهاد میشه.
حالا نوبت یک یادگیری مجدد و پروژه محوره که اینجا هیچی کگل نمیشه پس sql مقدماتی و پیشرفته کگل رو بگذرونین.
زبان R یک زبان برنامه نویسی محسوب میشه ولی کاربرد اصلیش توی تحلیل داده هاس و بحثای مربوط به مهندسی داده و بیشتر هم توی این حوزه توسعه میدنش و R در کنار پایتون یک ترکیب سمی میسازه البته پایتون قوی تره ولی بازم این دو تا کنار هم یه چیز دیگه میشن.
برای یادگیری R میتونین به سایت آنالیکا که متعلق به استاد مینویی عزیزم هست مراجعه کنید و اونجا آموزش های خیلی خوب و جامعی برای R گذاشته.
قبل از این بیشتر برای مصور سازی داده ها از کتابخونه های پایتون استفاده می کردیم ولی الان پیشنهاد من اینه به عنوان کسی که جونیورو رد کرده بیشتر با ابزار های تخصصی تر به مصور سازی داده ها و تحلیل کسب و کار بپردازید و در ابتدا یک سری مفاهیمی رو باید یاد بگیرید.
این مفاهیم(هوش تجاری،OLAP,OLTP, انبار داده,ETL,ELT و...) رو میتونید از سایت چیستیو یاد بگیرید.
بعد از این برین سراغ power bi(اکثر جاها tableau رو هم میگن و اگر خارج از کشور بودین منم میگم ولی تبلو فقط 14 روز رایگانه اگه اشتباه نکنم ولی بعدش پولی میشه که فک میکنم سالی حدود 5 میلیون باید پرداخت کنین البته به قیمت دلار چند هفته پیش که حساب کردم!) حقیقتا برای power bi منبع زیاده و قیمت ها از رایگان شروع میشه تا میلیونی و بسته به هدفتون باید پکیج رو انتخاب کنین ولی اگه پیشنهاد منو بخواین میگم با جهاد دانشگاهی شریف پیش برین بهتره!
در این مرحله شما میتونین سطح دانش ریاضی،الگوریتم و یادگیری ماشین خودتونو ارتقا بدین و مثلا الگوریتم های جدید یادگیری ماشین یا یادگیری عمیق رو یاد بگیرید.
برای ریاضیات میتونم تدریس مبانی علوم ریاضی برای علم داده دکتر جوادی که در دانشگاه صنعتی اصفهان تدریس شده رو معرفی کنم.
ایشون استاد خود من در سه درس ریاضی عمومی 1،مبانی ترکیبیات و نظریه بازی ها بودن(البته الان کامپیوتر میخونم!قبلا ریاضی بودم) از ویژگی های ایشون میشه به تدریس کامل،روون،فن بیان عالی و سطح بالای مطالب تدریس شده اشاره کرد.
برای یادگیری ماشین و عمیق پیشرفته بهترین ایده هایی که میتونم بدم ایناس:
این دوره فیلم ضبط شده ی کلاس خانم دکتر سلیمانی هست که خیلی کامل و مفید یادگیری ماشین رو تدریس کردن.نگران جزوه هم نباشید! اگر به صفحه ویرگول خانم مهدوی برید اونجا ایشون تمام این جلسات رو(هر 23 جلسه رو) جزوه برداری کردن(نت برداری با کیفیت) و به رایگان در اختیار عموم قرار دادن همچنین از آموزش های جبر خطی ایشون هم میتونید استفاده کنید.
به جرعت میشه گفت تو حوزه ماشین لرنینگ و دیپ لرنینگ اسم اندرو ان جی بیشتر از هر اسمی شنیده میشه و مکتب خونه دوره های ایشون رو به رایگان در اختیار عموم قرار داده(نگران اون مکتب پلاسش نباشین فیلمای دوره رایگانه اون پلاس مال کوییزاش و آزموناش و سرتیفیکیتشه که سرتیفیکیتشو کلا بیخیال چون سرتیفیکیت های مکتب خونه اونقدر ارزش نداره و من خودم یه بار اومدم سرتیفیکیت مکتب خونمو ارائه بدم بعد طرف بهم خندید گفت که چی؟اینو که هر کسی میتونه بگیره!آزموناش و کوییزاش و پروژه هاش هم که تو گیتهاب الا ماشالا ریخته(از جمله گیتهاب خودم!))
ولی چرا میگم از مکتب خونه ببینین؟
چون زیر نویس داره :)
ممکنه بگین خداییش من حوصله ی خوندن یک کتاب 800 صفحه ای زبان اصلی تو سطح ارشد و دکترا رو دیگه ندارم!
مام که نگفتیم خودت بخون!
برو فیلاگر اونجا خوانش گروهی دارن و اونا واست کتابو خلاصه کردن و واست توضیح میدن که خیلیم خوب تدریس می کنن و جدیدا هم هر 20 فصلش کامل شده.
نکته ی آخر هم اینکه دست از یادگیری نکشید.