ویرگول
ورودثبت نام
Abolfazl Samadi
Abolfazl Samadi
خواندن ۷ دقیقه·۳ سال پیش

اگر مجبور باشم دوباره یادگیریِ علم داده(Data Science) یا یادگیری ماشین(machine learning) را شروع کنم، چگونه این کار را انجام میدهم؟

به نام خدا

سلام به دوستان عزیز

یکی از پر تکرار‌ترین سوالی که از طرف کسانی که قصد فعالیت در حوزه‌های علم داده(Data Science) یا یادگیری ماشین (machine learning) دارن ، مطرح میشه اینه که “چه راهی را باید طی کنیم تا یک دانشمند داده یا یک مهندس یادگیری ماشین بشویم؟ ” .

در همین راستا سایت (kdnuggets.com) یک مقاله منتشر کرده و در آن یک نقشه راه (road map) پیشنهاد داده به کسانی که قصد یادگیری و کار در این حوزه را دارند(لینک این مقاله در آخر مطلب ذکر شده).

در ضمن این رو هم بگم که تمام دوره های معرفی شده در زیر ، رایگان است.

حالا بریم تا باهم این مقاله را بررسی کنیم و ببینیم باید از کجا شروع کنیم و ادامه بدیم یادگیری رو.

خب عنوان مقاله با این مضمون شروع میشه : اگر مجبور باشم دوباره یادگیری علم داده(Data Science) یا یادگیری ماشین(machin learning) را شروع کنم، چگونه این کار را انجام میدهم؟

اول مقاله این توضیح و میده که راه های زیادی برای شروع یادگیری در این حوزه وجود داره اما رویکردی برای شما مفیده که بر اساس یادگیری هرچه بهتر شما باشه.

یک روش قدرتمند اینه که یادگیری خود را از یک تمرین ساده به یک مبانی پیچیده تبدیل کنید.

در تصویر زیر یک شِمایِ کلی از مسیری که باید طی کنید را میبینید:

چه راهی را باید طی کنیم تا یک دانشمند داده یا یک مهندس یادگیری ماشین بشویم؟
چه راهی را باید طی کنیم تا یک دانشمند داده یا یک مهندس یادگیری ماشین بشویم؟

این مسیر یادگیری تدریجی از ساده به پیچیده است.شروع با مثال های عملی و سپس به سمت مفاهیم انتزاعی‌تر.

شاید خیلی ها بخوان با مفاهیم خیلی عمیق شروع کنند به یادگیری اما از دید نویسنده مقاله شروع کردن با یک کار عملی و ملموس به داشتن دید بهتر نسبت به کل تصویر کمک میکنه.

علاوه بر این تکمیل ۴ دوره اول که هرکدوم حدود ۴ ساعت زمان میبره ، باعث ایجاد انگیزه در افراد میشه.اگه با مفاهیم سنگین شروع کنید ممکنه براتون خسته کننده باشه و از این کار دل زده بشین.

  • نکته : لازم دونستم یه نکته ای رو اضافه کنم. اونم اینکه یادگیری مهارت های زیر بصورت خطی نیستند و شما باید به شکل یک چرخه اون هارو یاد بگیرید.مثلا شما ممکنه در حال یادگیری مهارت سوم باشید ولی نیاز دارین به مهارت اول که پایتون است مراجعه کنید تا براتون یاد آوری بشه.پس این مهارت ها رو بصورت خطی یاد نگیرید و هی مرور کنید مهارت ها رو تا با یادآوری بتونید هرچه بیشتر بهشون مسلط بشید.
  • لازم به ذکر است برای به بیشتر لینک ها باید vpn خود را روشن کنید.



  • شماره یک: Kaggle micro-course: Python : اولین دوره‌ای که بهتون پیشنهاد داده،‌ دوره پایتون سایت گکل هستش. دوره جادی در سایت مکتبخونه هم دوره با کیفیتی هستش از اون هم میتونید استفاده کنین.

پایتون یک از مهم ترین ابزار های افراد مشغول در این حوزه هست و شما برای رفتن به مراحل بعد باید به خوبی با پایتون آشنا باشین و بتونین باهاش کد بزنین.

این هم لینک دوره پایتون در سایت کگل :https://www.kaggle.com/learn/python



  • شماره دو: Kaggle micro-course: pandas : یکی از مهمترین کار‌های یک دانشمند داده، توانایی کار کردن روی داده هاست.یک از بهترین ابزار‌ها برای این کار که یکی از کتابخانه های پایتون است، کتابخانه pandas است که به شما امکان تغییر و دستکاری روی داده ها را میده.

پس مهارت بعدی که باید یاد بگیرید بعد از پایتون ، یکی از کتابخانه های پایتون ، pandas است.

این هم لینک دوره pandas در سایت کگل :https://www.kaggle.com/learn/pandas



  • شماره سه: Kaggle micro-course: Data visualization : خب مهارت بعدی، توانایی مجسم کردن داده هایی است که در اختیار دارین.این مهارت با وجود اینکه خیلی دست کم گرفته میشود اما جز مهمترین مهارت هاست که به شما امکان درک هرچه بهتر داده ها را میدهد.چند کتابخانه پایتون (مانند seaborn و matplotlib) این امکان را به شما میدهند که بتونید داده های خود را مصور سازی کنید.

این هم لینک دوره Data visualization در سایت کگل : https://www.kaggle.com/learn/data-visualization

امیدوارم متوجه شده باشید که پایتون چقدر امکان در اختیار شما قرار میدهد.خوب یاد بگیریدش.



  • شماره چهار: Kaggle micro-course: intro to Machine Learning : خب خب موقعشه که یادگیری ماشین رو شروع کنیم.با این دوره از سایت کگل شما مهارت های ابتدایی و مفاهیم ابتدایی یادگیری ماشین را فرا میگیرید.

این هم لینک دوره مقدماتی یادگیری ماشین در سایت کگل :https://www.kaggle.com/learn/intro-to-machine-learning



  • شماره پنج: Kaggle micro-course: intermediate Machine Learning : این دوره که یک سطح بالاتر از دوره قبلی است، مکملی برای دوره بعدی میباشد.در این دوره شما بیشتر با متغیر‌های دسته بندی و فیلد های خالی در داده ها ،سر کار دارید.

این هم لینک این دوره در سایت کگل : https://www.kaggle.com/learn/intermediate-machine-learning



  • شماره شش: Kaggle playground competition: Titanic : در این مسابقه که یک دیتاستی از افرادی است که در کشتی تایتانیک حضور داشتند، شما باید مهارت هایی که تا کنون فرا گرفته اید را بصورت عملی انجام دهید.هم ترستون از مواجه با دیتای واقعی میریزه و هم یه سنجشی است از اینکه ببینید چقدر مهارت های قبلی رو خوب یاد گرفتید.

این هم لینک این قسمت : https://www.kaggle.com/c/titanic



  • شماره هفت: Kaggle playground competition: Housing prices : در این قسمت هم مانند قسمت قبل باید با دیتای واقعی کارکنید و این بار باید مدل های رگرسیون را اعمال کنید.

این هم لینک این قسمت : https://www.kaggle.com/c/home-data-for-ml-course



  • شماره هشت: Book: Data science from scratch : در این مرحله وقتش رسیده که روی مفاهیم پایه ای و مهم بیشتر کار کنیم و این قسمت بهتون پیشنهاد یک کتاب رو میده به نام “علم داده از پایه”.شما با اینکه کتاب که به زبان انگلیسی هم هست و با سرچ در گوگل میتونید دانلودش کنین، میتونید با مهم ترین مفاهیم در این حوزه آشنا شده و آن ها را یاد بگیرید.شما در این کتاب با مثال های عملی الگوریتم های یادگیری ماشین را یاد میگیرید و در آن مثال هایی از زبان پایتون برای هر مبحث آورده شده و این کتاب به دور از هر گونه ریاضیات پیچیده است.زبان این کتاب بسیار روان و دوستانه است.
  • نکته: نویسنده گفته اگه مطالبی که تا اینجا گفته شده را به خوبی فرا گرفته باشید ، کاملا قادر به کار در علم داده هستید و پیشنهاد داده که در مسابقات و انجمن های مختلف در این حوزه شرکت کنین و به دنبال کشف راه حل های جدید در مسابقات که افراد دیگر آن را حل کرده اند باشید.



  • شماره نه: Online course: Machine Learning by Andrew Ng : در این مرحله ، دوره بسیار خوب و مفیدِ یادگیری ماشین از سایت کورسرا را بهتون پیشنهاد داده. در این دوره بیشتر مهارت های قبلی که یاد گرفتید را خواهید دید اما از زبان یکی از رهبران این حوزه که آقای Andrew Ng هستند.در این دوره شما درک بهتر و بیشتری از مواردی که فرا گرفتید را کسب خواهید کرد اما با رویکردی یک مقدار ریاضی‌تر.اگر مدرک این دوره را بخواهید باید هزینه آن را پرداخت کنید ولی اگر نیاز به مدرک ندارید ، این دوره هم مثل دوره های قبلی رایگان میباشد.

این هم لینک این دوره : https://www.coursera.org/learn/machine-learning



  • شماره ده: Book: The Elements of statistical learning : اکنون قسمت ریاضیت کمی سنگین شروع میشود.این کتاب بهتون ریاضیات سنگین تر این حوزه را آموزش میدهد.

این کتاب هم با سرچ در گوگل میتوانید پیدا کنید.



  • شماره یازده: Online course: Deep Learning by Andrew Ng : احتمالا شما با یادگیری عمیق تا اینجای اشنا شده اید اگر مراحل بالا را طی کنید.اما در این دوره شما پایه های شبکه عصبی و نحوه کار آن ها را خواهید آموخت و یاد میگیرید که از معماری های مختلف موجود ، استفاده کنید.

این هم لینک این دوره : https://www.deeplearning.ai/deep-learning-specialization/



  • در این مرحله بسته به علاقه خودتون باید تصمیم بگیرید که در کدام بخش بیشتر متمرکز بشید و کارکنید.یادگیری عمیق یا مباحث رگرسیون و سری های زمانی.

امیدوارم خیلی پر قدرت این مسیر و طی کنید و بتونید به اون چیزی که میخواهید برسید.

و در آخر هم لینک مقاله که به زبان انگلیسی است : https://www.kdnuggets.com/2020/08/start-learning-data-science-again.html

چطور یک دانشمند داده بشمچطور یک مهندس یادگیری ماشین بشمنقشه راه یک تبدیل شدن به یک دانشمند داده یا مهندس یادگیری ماشینdata sciencemachine learning
شاید از این پست‌ها خوشتان بیاید