زمانی‌که ماشین‌ها بهتر از انسان‌ها بازی می‌کنند!

شکل ۱. بازی کلاسیک ویدئویی
شکل ۱. بازی کلاسیک ویدئویی


منتشر‌شده در techxplore به تاریخ ۲۵ فوریه ۲۰۲۱
لینک منبع : Reinforcement learning algorithms score higher than humans, other AI systems at classic video games

یک تیم از محققان آزمایشگاهUber AI در سان‌فرانسیسکو مجموعه‌ای از الگوریتم‌های یادگیری را توسعه داده‌اند که ثابت شده است در بازی بازی‌های ویدئویی کلاسیک بهتر از بازیکنان انسانی یا دیگر سیستم‌های AI هستند. در مقاله منتشر شده در مجله Nature، محققان توضیح می‌دهند که چگونه الگوریتم‌های آن‌ها از دیگران متفاوت است و چرا آن‌ها بر این باورند که در روباتیک، پردازش زبان و حتی طراحی داروهای جدید کاربرد دارند.

الگوریتم‌های یادگیری تقویتی یاد می‌گیرند که چگونه کارها را با ترکیب اطلاعات ارائه‌شده در یک مجموعه داده بزرگ انجام دهند - آن‌ها الگوها را تشخیص می‌دهند و از آن‌ها برای حدس زدن در مورد داده‌های جدید استفاده می‌کنند. این روشی است که الگوریتم‌های یادگیری تقویتی برای تشخیص سرطان ریه در اشعه ایکس به کار می‌روند. اما همانطور که محققان به این تلاش جدید اشاره می‌کنند، چنین الگوریتم‌هایی وقتی با داده‌هایی مواجه می‌شوند که با سایر داده‌های موجود در مجموعه داده متناسب نیستند، دچار مشکل می‌شوند. به همین دلیل است که چنین سیستم‌هایی گاهی اوقات می‌توانند نتایج نادرست را برگردانند.

مطالعه مقاله ۵ دلیل برای اینکه چرا باید از پایتون و AI در بازی‌سازی استفاده کرد! توصیه می‌شود.

در این تلاش جدید، محققان با اضافه کردن الگوریتمی که تمام مسیرهایی را که الگوریتم قبلی برای حل یک مساله در نظر گرفته بود را به یاد می‌آورد، بر این مشکل غلبه کرده‌اند. زمانی که یک نقطه داده پیدا می‌کند که درست به نظر نمی‌رسد، به نقشه حافظه خود باز می‌گردد و مسیر دیگری را امتحان می‌کند. از نظر بازی کردن بازی‌های ویدئویی، زمانی‌که بازی می‌کند، عرصه را به دست می‌گیرد و وقتی خود را در حال باخت می‌بیند، به نقطه دیگری در بازی بر‌می‌گردد و رویکرد دیگری را امتحان می‌کند. این الگوریتم همچنین تصاویری را با هم گروه‌بندی می‌کند که شبیه به این هستند که تشخیص دهند اگر همه چیز خراب شود در آن نقطه از زمان باید به کجا برگردد.

محققان رویکرد جدید خود را با افزودن قوانین بازی و یک هدف امتحان کردند - بیش‌ترین امتیازات ممکن را به دست آوردند و سعی کردند هر بار به امتیاز بالاتری دست یابند. سپس آن‌ها از سیستم خود برای انجام ۵۵ بازی آتاری استفاده کردند که در طول زمان تبدیل به معیاری برای آزمایش سیستم‌های AI شده‌اند. این سیستم جدید ۵ / ۸۵ درصد دیگر سیستم‌های AI را شکست داده است. این کار به ویژه در انتقام مونتزو خوب عمل کرد، و بیش از هر سیستم دیگر AI امتیاز گرفت و رکورد یک انسان را شکست داد.

محققان بر این باورند که الگوریتم آن‌ها می‌تواند به کاربردهای دیگر مانند پردازش تصویر یا زبان توسط ربات‌ها منتقل شود.

این متن با استفاده از ربات مترجم مقاله هوش مصنوعی ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.