من احسان حیدری ام و توی این پست های سریالی که در ویرگول و وبسایت خودم منتشر میشه، قصد دارم از نقشه مسیر راه یادگیری ماشین لرنینگ و یا یادگیری ماشین، براتون بنویسم و هر چیزی که فهمیدم روبه زبان ساده تر، حالا چه در قالب ویدیو ، چه در قالب نوشته های مکتوب بهتون انتقال بدم.
فرض کنیم که :
شما صاحب یک سرویس ارائه دهنده بستر ارسال ایمیل، مثل جیمیل و یا یاهو هستید. ایمیل های متفاوتی ارسال میشه، که مخاطب هاتون رو اذیت میکنه، و یا به قولی " اسپم " هستن، چه راهکاری برای مقابله این ها داره ؟ یک لحظه فکر کنید که اصلا الان جیمیل و یا یاهو چی کار می کنه . این دقیقا " همون کاری هست که ماشین لرنینگ " انجام میده، یعنی بدون اینکه برنامه نویس دخالت داشته باشه، فرآیندی طراحی شده که به ماشین یا همون کامپیوتر یاد میده که " این موارد رو ببین " ، این " خروجی رو بده" .
ماشین لرنینگ و یادگیری ماشین کاربرد های متفاوتی داره که درآمد های بسیار بالایی رو هم براتون به رقم میزنه قطعا ، در تشخیص و انالیز صدا، متن و نوشتار، رباتیک ، NLP و .... و جزء پردرآمد ترین شغل های دنیاست.
اما در اصل ماشین لرنینگ میتونه زیر شاخه از هوش مصنوعی باشه .
اگر شما قصد یادگیری ماشین لرنینگ رو دارید بهتون پیشنهاد میکنیم که :
حتما روش های تحلیل و طراحی الگوریتم ها رو بلد باشید همینکه بتونید تحلیل بکنید کافیه، بچه های کامپیوتر تو کارشناسی فکر میکنم این مبحث رو پاس میکنن .
جبر خطی رو در حد اینکه به ماتریس ها ، بردار ها، عملیات ماتریسی و دستگاه های معادلات خطی و ماتریس وارون ها و بردار های ویژه و مرتبه ماتریس تسلط داشته باشید کافیه .
مشتق و انتگرال بلد باشید
و احتمالات در حد کارشناسی که آمار احتمالات پاس می کنید خوبه اما همینکه تعاریفی مثل متغیر های تصادفی، مقدار مورد انتظار و واریانس رو یادتون باشه و ازش کمک بگیرید قطعا کمک کننده است.
بزارید بر اساس تعاریف با هم صحبت کنیم :
تام میشل در سال 1998 این تعریف رو ارائه میده :
با داشتن یک وظیفه مانند T ، و یک معیار کارایی مانند P می گوییم یک برنامه کامپیوتری از تجربه E یاد میگیرد و اگر معیار کارایی آن برنامه یعنی P برای انجام وظیفه T با استفاده از تجربه E بهبود یابد.
چند تا مثال بزنم براتون که بیشتر جا بی افته ، یکم قبل تر از آقای تام میشل، آقای آرتور ساموئل که یه چکرز باز قدری بوده، میاد یک برنامه ای می نویسه که چکرز خودش با خودش بازی میکنه و از این بازی کردن های متعدد اینقدر قوی میشه که میتونه نویسنده خود این فرایند رو ببره . این اتفاق برای یکی از قهرمامان شطرنج هم افتاد که از قهرمان شطرنج زمان خودش باخته .
مثلا :
برای بازی چکرز
T: انجام بازی متعدد
P: اگر مثلا با صد نفر بازی میکنه ، تعداد قابل توجهی ببره مثلا اگر 97 باشه خوبه!
E: هزاران بار بازی در مقابل خودش تجربه ای خوبی رو ارائه میده و کامپیوترم خسته نمیشه
یا مثلا در باب تشخیص اسپم یا هرزنامه بودن ایمیل ها :
T: جدا کردن ایمیل های هرزنامه از اصلی
P: تشخیص درست ایمیل های اسپم که ایمیل های اساسی به اسپم نره
E: هر بار ایمیل که دریافت میشه یک تجربه به تجربه ها اضافه میشه .
جا داره که اینجا یه نقل قول کنیم از آقای بیل گیتس که میگه ، هر گام پیشرفت در ماشین لرنینگ ، ده ها برابر ماکروسافت ارزش داره، اگر ده دوازده سال پیش از سیستم یاهو استفاده می کردید تقریبا از هر 10 تا ایمیل 4 تاش با اینکه اسپم نبود میرفت اسپم و میگفتن " اسپمتم چک کن" شاید اونجاست، الان این اتفاق و این مشکل کم تر رخ میده و اون هم به خاطر تجربه هایی هست که ایمیل ها دارن از گزارش دادن کاربر ها به کامپیوتر میدن و هزاران ایمیلی که رد و بدل شده قطعا تجربه سیستم رو بالا تر برده .
---
ادامه دار خواهد بود.
Ehsan Heydari - احسان حیدری