یادگیری تقویتی در چند دهه گذشته راه پرفرازونشیبی را پیموده است، راهی که امروز هموارتر و چشمنوازتر از گذشته به نظر میرسد. اما این راه به کدام سو میرود و چه مقصدی را میتوان انتظار داشت؟
در سالیان اخیر، یادگیری تقویتی در تکامل مدلهای زبانی مثل chatGPT سهم اساسی داشته است. در واقع مشکل مدلهای زبانی اولیه این بود که چندان برای گفتگو با انسانها آماده نبودند. اما با آموزش همین مدلها در قالب یادگیری تقویتی و پاداشدهی به پاسخهای آنها، زمینه برای مدلهای سازگارتر با خواستههای کاربران فراهم شد.
با این اوصاف، آیا یادگیری تقویتی ما را در نهایت به هوش مصنوعی جامع (AGI) خواهد رساند؟ این پرسش دشواری از چند جهت است. اول این که بسیاری باور دارند چیزی تحت عنوان «هوش مصنوعی جامع» نداریم. چالش دیگر آن است که فرآیند پژوهش و توسعه به صورت تکاملی و بدون یک مغز متفکر واحد به پیش میرود.
در نهایت نباید از خاطر برد که پژوهش همواره این توانایی را دارد که ما را غافلگیر سازد و چه بسا فناوری جدیدی ظهور کند، یا یک ایده قدیمی دوباره جان تازهای پیدا کند و یادگیری تقویتی را کنار بگذارد (یا بهتر، آن را تقویت سازد!).
متن کامل یادداشت را در لینک زیر بخوانید.