اینجا در مورد برنامهنویسی علمی و فنی، مدیریت کارها و کمی هم در رابطه با کتاب مینویسم.
قسمت صفر:دوره یادگیری ماشین برای روزهای قرنطینه
احتمالا شما هم این روزهای که درگیر قرنطینه هستید برای استفاده بهینه از اوقاتتون در جستوجوی پیدا کردن راهحلهای مختلف هستید. یکی از این راهحلها یادگیری چیزهای جدید هست، از هنر گرفته تا یادگرفتن کامپیوتر و حتی جذابتر از اون یاد دادن به کامپیوتر.
اگر افرادی هستید که به کامپیوتر،داده و ریاضیات علاقهمند باشید میتونید از افرادی باشید که با استفاده از ماشین لرنینگ کارهای خلاقانهای انجام بدید و وارد دنیای جدیدی بشید. قبل از هرچیز بهتره بگیم این دوره به درد چه افرادی می خوره:
- افرادی که عاشق یادگرفتن هستند.
- افرادی که دوست دارن بدونن یادگیری ماشین چه جوری کار میکنه.
- افرادی که دسترسی به دادههای زیادی دارن ولی نمی دونن که چه جوری میشه از این دادهها استفاده کرد.(مثل فروشنده های اینترنتی نسبتا کوچک)
- افرادی که دوست دارن بتونن آینده رو پیشبینی کنند.*( مثل پیشبینی قیمت سهام، فروش نفت یا فارکس)
- افرادی که دوست دارند کارهای خودشون رو مثل دستهبندی متنها و عکسها خودکار کنند.
توی این دوره چه چیزهایی یاد میگیریم
توی این دوره از مباحث پایهای یادگیری ماشین مثل پیشپردازش(preproccesing)، بیشبرازش(overfitting) شروع میکنیم و بعد از اون مدلهای کلاسیک ماشین لرنینگ مثل رگرسیون ، درخت تصمیم، مدلهای SVM و چند مدل یادگیری بدون ناظر مثل نزدیکترین همسایه(nearest neighbor) رو مرور میکنیم.بعد از اون سعی میکنیم راجع به تنظیم پارامترهای هایپر**(hyper parameter tuning) و انتخاب مدل مناسب برای کارمون صحبت می کنیم.
بعد از اون وارد فضای جدیتر میشیم و سعی میکنیم با شبکههای عصبی آشنا شیم. توی این بخش دو مورد RNN و CNN رو به صورت ویژهتر پوشش میدیم و سعی میکنیم که با استفاده از این ابزارها ۲ تا کار جذاب رو انجام بدیم. یکی دستهبندی تصاویر و یکی ساخت موسیقی که شاید به گوش همه هم خوش نباشه.?
در آخر هم سعی میکنیم با reinforcement learning به کامپیوتر یاد بدیم که خودش از خودش یادبگیره و یک بازی ساده رو به صورت خودآموز یادبگیره و توش خبره بشه.
به صورت مشخص ما توی این دوره سعی میکنیم با استفاده از دوکتابخانه محبوب sci-kit learn و tensorflow مسائل یادگیری ماشین رو حل کنیم.
هرچند الان سیلابس دوره مشخص هست ولی ممکنه بنا به شرایط کمیتغییر کنه.
برای استفاده از این دوره نیازمند چه چیزهایی هستم؟
- شما باید تا حد خوبی با پایتون آشنا باشید، توی اینترنت به راحتی میتونید محتوای آموزشی خوبی به فارسی و انگلیسی برای این زبان پیدا کنید. احتمالا آموزش رایگان جادی در گوکلاس یکی از گزینههای خوب برای شروع است.
- علاوه بر آشنایی مقدماتی با پایتون بلد بودن numpy و pandas میتونه خیلی جاها به شما کمک کنه. اگر با این دو بخصوص pandas آشنایی دارید احتمالا از این دوره استفاده بهتری خواهید داشت. برای شروع میتونید یک نگاه به ۱۰ دقیقه تا pandas داشته باشید.
- یک کامپیوتر که روش پایتون نصب باشه خیلی خوبه ولی اگر پایتون نصب نداشتید نگران نباشید. کدها در گیتهاب این دوره به صورتی ذخیره میشه که بتونید بدون نیاز به نصب چیز جدیدی اونها رو توی مرورگرتون اجرا کنید.
- از همه چیز مهمتر علاقه.
این دوره در هر هفته دو تا سه مطلب جدید ارائه میده. برای مطلع شدن از اون میتونید من این پست رو بوکمارک کنید( من فهرست مطالب رو اینجا بروز میکنم) و یا من رو در ویرگول دنبال کنید. علاوه بر این اگر مایل بودید میتونید توی این بخش ایمیل خودتون رو وارد کنید تا بعد از انتشار هر پست به شما اطلاعرسانی بشه و صدالبته تلاش میکنم محتوای اختصاصی هم برای مخاطبین ایمیلی مثل کتاب رایگان آماده و ارسال کنیم.
جدید: میتونید برای دسترسی به محتوای ویژه در کانال تلگرام دوره هم عضو بشید.
فهرست مطالب
۰-مقدمه دوره یادگیری ماشین(همین پست)
۲- پیاده سازی اولین مدل یادگیری ماشینی
۳- آشنایی با کتابخانه scikitlearn رگرسیون لاجستیک
۴- پردازش دادهها با sklearn و pandas
پ.ن:
* واقعیت اینه که پیشبینی همیشه با خطا همراهه و این مسئله به صورت خاص در مورد سهام بیشتر رخ میده به عنوان کسی که مدتهاست در حال کار با یادگیری ماشین و بورس هست بهتون توصیه میکنم که از این بخش فقط برای یادگیری استفاده کنید و برای سرمایهگذاری از روشهای مطمئنتر مثل صندوقهای سرمایهگذاری استفاده کنید.
** من سعی میکنم که از مطالب بعدی از واژههای انگلیسی با تایپ انگلیسی برای معرفی مفاهیم استفاده کنم. احتمالا ترجمه این عبارات باعث گیج شدن شما و البته مشکل شدن جستوجوهای آتی شما میشه.
*** تا زمان انتشار پست جدید میتونید به صفحه بورس تهران در پایتون در ویرگول و گیتهاب سر بزنید و کمی با استفاده از pandas با دادههای بورس ایران کار کنید.
مطلبی دیگر از این انتشارات
کلان داده ابری (Big Data as a Service) چیست؟
مطلبی دیگر از این انتشارات
دیتاست بنچ مارک یادگیری عمیق(بخش دوم)
مطلبی دیگر از این انتشارات
کگل(Kaggle) چیست(قسمت دوم )