معرفی منابع یادگیری تقویتی(Reinforcement Learning)

یادگیری تقویتی یا همان Reinforcement Learning نوعی از یادگیری‌ماشین و هوش‌مصنوعی است که ماشین توسط تعامل با محیط و مشاهده‌ی پاسخِ محیط، یادگیریِ خود را انجام می‌دهد. در این‌جا نمی‌خواهیم به توضیحِ یادگیری تقویتی بپردازیم و فقط چند منبع برای شروع و درکِ الگوریتم‌های آن می‌آوریم.

۲ مرجع اصلی در این حوزه به صورت رایگان موجود است:

اولی کتاب معروفِ آقای ساتون است که می‌توانید از این‌جا دانلود کرده و مطالعه کنید. این کتاب به صورت تقریباً کاملی، مباحث حوزه‌ی یادگیری تقویتی را باز کرده است و پیش‌زمینه‌های لازم را نیز به همراه مثال‌هایی گردآوردی و تالیف کرده.

دومی کتابِ رایگان آقای زپشواری قابل دانلود در این‌جا است. کتاب آقای زپشواری سعی در خلاصه‌سازی مباحث یادگیری تقویتی کرده است و حجم آن حدوداً یک چهارم کتاب آقای ساتون هست.

همچنین دوره‌ی Udacity نیز به صورت تقریباً کاملی، مباحثِ پایه‌ی یادگیری تقویتی را شرح داده است.

اما هر چقدر هم که کتاب‌ها و دروسِ آکادمیک را مرور کنیم، مانندِ دست به کُد شدن، کاربردی به نظر نمی‌رسد. پس بهتر است از کتابخانه‌ای مانند OpenAI Gym در پایتون جهتِ درکِ عملیِ یادگیری تقویتی استفاده کنیم. برای شروع در این‌جا یک آموزش مقدماتی و کاربردی با پایتون و Gym قرار داده شده است.

اگر هم می‌خواهید خیلی یک‌راست سراغ کد رفته و از هیچ کتابخانه‌ای استفاده نکنید، در این‌جا یکی از الگوریتم‌های معروفِ یادگیریِ تقویتی به همراه کدِ پایتون آموزش داده شده است.