قسمت صفر:دوره یادگیری ماشین برای روزهای قرنطینه

احتمالا شما هم این‌ روزهای که درگیر قرنطینه‌ هستید برای استفاده بهینه از اوقاتتون در جست‌وجوی پیدا کردن راه‌حل‌های مختلف هستید. یکی از این راه‌حل‌ها یادگیری چیزهای جدید هست، از هنر گرفته تا یادگرفتن کامپیوتر و حتی جذاب‌تر از اون یاد دادن به کامپیوتر.

اگر افرادی هستید که به کامپیوتر،داده و ریاضیات علاقه‌مند باشید می‌تونید از افرادی باشید که با استفاده از ماشین لرنینگ کارهای خلاقانه‌ای انجام بدید و وارد دنیای جدیدی بشید. قبل از هرچیز بهتره بگیم این دوره به درد چه افرادی می خوره:

  • افرادی که عاشق یادگرفتن هستند.
  • افرادی که دوست دارن بدونن یادگیری ماشین چه جوری کار می‌کنه.
  • افرادی که دسترسی به داده‌های زیادی‌ دارن ولی نمی دونن که چه جوری میشه از این داده‌ها استفاده کرد.(مثل فروشنده های اینترنتی نسبتا کوچک)
  • افرادی که دوست دارن بتونن آینده رو پیش‌بینی کنند.*( مثل پیش‌بینی قیمت سهام، فروش نفت یا فارکس)
  • افرادی که دوست دارند کارهای خودشون رو مثل دسته‌بندی متن‌ها و عکس‌ها خودکار کنند.
عکس از ارسنی توگلف از آنسپلش
عکس از ارسنی توگلف از آنسپلش

توی این دوره چه چیزهایی یاد میگیریم

توی این دوره از مباحث پایه‌ای یادگیری ماشین مثل پیش‌پردازش(preproccesing)، بیش‌برازش(overfitting) شروع می‌کنیم و بعد از اون مدل‌های کلاسیک ماشین لرنینگ مثل رگرسیون ، درخت تصمیم، مدل‌های SVM و چند مدل یادگیری بدون ناظر مثل نزدیک‌ترین همسایه(nearest neighbor) رو مرور می‌کنیم.بعد از اون سعی می‌کنیم راجع به تنظیم پارامتر‌های هایپر**(hyper parameter tuning) و انتخاب مدل مناسب برای کارمون صحبت می کنیم.

بعد از اون وارد فضای جدی‌تر میشیم و سعی می‌کنیم با شبکه‌های عصبی آشنا شیم. توی این بخش دو مورد RNN و CNN رو به صورت ویژه‌تر پوشش می‌دیم و سعی می‌کنیم که با استفاده از این ابزار‌ها ۲ تا کار جذاب رو انجام بدیم. یکی دسته‌بندی تصاویر و یکی ساخت موسیقی که شاید به گوش همه هم خوش نباشه.?

در آخر هم سعی می‌کنیم با reinforcement learning به کامپیوتر یاد بدیم که خودش از خودش یادبگیره و یک بازی ساده رو به صورت خودآموز یادبگیره و توش خبره بشه.

به صورت مشخص ما توی این دوره سعی می‌کنیم با استفاده از دوکتابخانه محبوب sci-kit learn و tensorflow مسائل یادگیری ماشین رو حل کنیم.

هرچند الان سیلابس دوره مشخص هست ولی ممکنه بنا به شرایط کمی‌تغییر کنه.



برای استفاده از این دوره نیازمند چه چیزهایی هستم؟

  • شما باید تا حد خوبی با پایتون آشنا باشید، توی اینترنت به راحتی میتونید محتوای آموزشی خوبی به فارسی و انگلیسی برای این زبان پیدا کنید. احتمالا آموزش رایگان جادی در گوکلاس یکی از گزینه‌های خوب برای شروع است.
  • علاوه بر آشنایی مقدماتی با پایتون بلد بودن numpy و pandas می‌تونه خیلی جاها به شما کمک کنه. اگر با این دو بخصوص pandas آشنایی دارید احتمالا از این دوره استفاده بهتری خواهید داشت. برای شروع می‌تونید یک نگاه به ۱۰ دقیقه تا pandas داشته باشید.
  • یک کامپیوتر که روش پایتون نصب باشه خیلی خوبه ولی اگر پایتون نصب نداشتید نگران نباشید. کدها در گیتهاب این دوره به صورتی ذخیره میشه که بتونید بدون نیاز به نصب چیز جدیدی اونها رو توی مرورگرتون اجرا کنید.
  • از همه چیز مهمتر علاقه.

این دوره در هر هفته دو تا سه مطلب جدید ارائه میده. برای مطلع شدن از اون می‌تونید من این پست رو بوک‌مارک کنید( من فهرست مطالب رو اینجا بروز می‌کنم) و یا من رو در ویرگول دنبال کنید. علاوه بر این اگر مایل بودید می‌تونید توی این بخش ایمیل خودتون رو وارد کنید تا بعد از انتشار هر پست به شما اطلاع‌رسانی بشه و صدالبته تلاش می‌کنم محتوای اختصاصی هم برای مخاطبین ایمیلی مثل کتاب رایگان آماده و ارسال کنیم.

جدید: می‌تونید برای دسترسی به محتوای ویژه در کانال تلگرام دوره هم عضو بشید.

https://bit.ly/2UgZhOp

فهرست مطالب

۰-مقدمه دوره یادگیری ماشین(همین پست)

‍۱-یادگیری ماشین چیست؟

۲- پیاده سازی اولین مدل یادگیری ماشینی

۳- آشنایی با کتابخانه scikitlearn رگرسیون لاجستیک

۴- پردازش داده‌ها با sklearn و pandas



پ.ن:

* واقعیت اینه که پیش‌بینی همیشه با خطا همراهه و این مسئله به صورت خاص در مورد سهام بیشتر رخ می‌ده به عنوان کسی که مدت‌هاست در حال کار با یادگیری ماشین و بورس هست بهتون توصیه می‌کنم که از این بخش فقط برای یادگیری استفاده کنید و برای سرمایه‌گذاری از روش‌های مطمئن‌تر مثل صندوق‌های سرمایه‌گذاری استفاده کنید.

** من سعی می‌کنم که از مطالب بعدی از واژه‌های انگلیسی با تایپ انگلیسی برای معرفی مفاهیم استفاده کنم. احتمالا ترجمه این عبارات باعث گیج شدن شما و البته مشکل شدن جست‌وجوهای آتی شما میشه.

*** تا زمان انتشار پست جدید می‌تونید به صفحه بورس تهران در پایتون در ویرگول و گیتهاب سر بزنید و کمی با استفاده از pandas با داده‌‌های بورس ایران کار کنید.