Senior Data Scientist at SabaIdea (Filimo, Aparat, Cinematicket) | Founder Of: chistio.ir
دپامین(Dopamine) کتابخانه جدید گوگل برای یادگیری تقویتی(Reinforcement Learning)
یادگیری تقویتی یا همان Reinforcement Learning یکی از زیر شاخههای دادهکاوی و هوش مصنوعی است که در چند سال اخیر مورد توجه بسیاری از محققین دادهکاوی قرار گرفته است. اگر بخواهیم به صورت ساده بگویم، یادگیری تقویتی در واقع یادگیری بر اساس تعامل متداوم با محیط اطراف و گرفتن جایزه و امتیاز از محیط است. فرض کنید یک گربه میخواهد در یک محله زندگی کند. این گربه همواره با محیط در تعامل است و همواره از محیط یاد میگیرد. مثلا نگاه میکند مادرش چگونه موش شکار میکند و سیر میشود. او هم موش شکار کردن را با تعامل و سعی و خطا در محیط انجام میدهد و موش میگیرد و سیر میشود(جایزه مثبت). او از بچهها فرار میکند. چون یک بار که از دست بچهها فرار نکرد یک دمپایی خورد و دردش گرفت(جایزه منفی). به این ترتیب گربه سعی میکند تا جایی که میتواند جایزه بگیرد(بیشینه سازی دریافت جایزه).
محققان علوم کامپیوتر هم به همین نتیجه رسیدهاند که میتوانند عامل(Agent)هایی را توسعه دهند که با همکاری با محیط یادگیری را انجام داده و به هدف نهایی برسند.
در ادامه این تحقیقات شرکت گوگل که سرمایه گذاری عظیمی بر روی پروژههای هوش مصنوعی کرده است، اینبار یکی از کتابخانههای خود به اسم دپامین را به صورت رایگان و متنباز در اختیار محققان قرار داده است تا محققان و دادهکاوها بتوانند عملیات مختلف یادگیری تقویتی و الگوریتمهای مختلف آن را با سرعت بیشتر اجرا کنند و درگیر پیادهسازی جزئیات نشوند.
دپامین بر روی بستر Tensorflow قرار دارد. Tensorflow که یکی از کتابخانههای بسیار قدرتمند در حوزه دادهکاوی است میتواند عملیات دادهکاوی را بر روی گراف با سرعت بالایی انجام دهد. کتابخانه دپامین را به همراه منابع و مقالات پایه آن میتوانید از این لینک دانلود کرده و با زبان پایتون از آن استفاده کنید.
مطلبی دیگر از این انتشارات
گردش کار(workflow) در تیمهای یادگیری ماشین و دادهکاوی
مطلبی دیگر از این انتشارات
پیادهسازی الگوریتم ژنتیک با استفاده از پایتون
مطلبی دیگر از این انتشارات
شبکه عصبی بازگشتی (Recurrent Neural Networks)