دپامین(Dopamine) کتابخانه جدید گوگل برای یادگیری تقویتی(Reinforcement Learning)

یادگیری تقویتی یا همان Reinforcement Learning یکی از زیر شاخه‌های داده‌کاوی و هوش مصنوعی است که در چند سال اخیر مورد توجه بسیاری از محققین داده‌کاوی قرار گرفته است. اگر بخواهیم به صورت ساده بگویم، یادگیری تقویتی در واقع یادگیری بر اساس تعامل متداوم با محیط اطراف و گرفتن جایزه و امتیاز از محیط است. فرض کنید یک گربه می‌خواهد در یک محله زندگی کند. این گربه همواره با محیط در تعامل است و همواره از محیط یاد میگیرد. مثلا نگاه می‌کند مادرش چگونه موش شکار می‌کند و سیر می‌شود. او هم موش شکار کردن را با تعامل و سعی و خطا در محیط انجام می‌دهد و موش می‌گیرد و سیر می‌شود(جایزه مثبت). او از بچه‌ها فرار می‌کند. چون یک بار که از دست بچه‌ها فرار نکرد یک دمپایی خورد و دردش گرفت(جایزه منفی). به این ترتیب گربه سعی می‌کند تا جایی که می‌تواند جایزه بگیرد(بیشینه سازی دریافت جایزه).

محققان علوم کامپیوتر هم به همین نتیجه رسیده‌اند که می‌توانند عامل(Agent)هایی را توسعه دهند که با همکاری با محیط یادگیری را انجام داده و به هدف نهایی برسند.

در ادامه این تحقیقات شرکت گوگل که سرمایه گذاری عظیمی بر روی پروژه‌های هوش مصنوعی کرده است، اینبار یکی از کتابخانه‌های خود به اسم دپامین را به صورت رایگان و متن‌باز در اختیار محققان قرار داده است تا محققان و داده‌کاوها بتوانند عملیات مختلف یادگیری تقویتی و الگوریتم‌های مختلف آن را با سرعت بیشتر اجرا کنند و درگیر پیاده‌سازی جزئیات نشوند.

دپامین بر روی بستر Tensorflow قرار دارد. Tensorflow که یکی از کتابخانه‌های بسیار قدرتمند در حوزه داده‌کاوی است می‌تواند عملیات داده‌کاوی را بر روی گراف با سرعت بالایی انجام دهد. کتابخانه دپامین را به همراه منابع و مقالات پایه آن می‌توانید از این لینک دانلود کرده و با زبان پایتون از آن استفاده کنید.