دیپ مایند، یاد میگیرد آتاری بازی کند!

در این ویدئوی کوتاه (1:47) و جذاب، می بینیم که چطور الگوریتم DeepMind گوگل یاد میگیرد که بازی قدیمی آتاری، Bricks را بازی کند.

https://www.aparat.com/v/Efy5w


اینکه میگوییم یاد می گیرد شاید نیاز به توضیح داشته باشد:
در واقع به الگوریتم هیچ چیزی در مورد بازی و اینکه چطور باید بازی را انجام دهد، گفته نمی شود. حتی اینکه اینجا یک توپ است و تو باید آن را بزنی!
تنها چیزی که به او گفته می شود اینست که باید امتیازت را در کمترین زمان بالاتر ببری. همین! و در محیط رها میشود.

اول حرکات رندوم و به نظر بی هدفی انجام می دهد. اما کم کم می فهمد که می تواند آن مستطیل (راکت) را حرکت دهد. و جلوتر یاد میگیرد که انگار اگر موقعیت مستطیل را زیر دایره متحرک قرار دهد ایده بدی هم نیست.

خلاصه خودتان ببینید که چطور تنها بعد از دو ساعت، نه تنها از انسان بهتر بازی می کند، بلکه بهترین استراتژی برای بردن را هم پیدا می کند!