برنامه ریزی استراتژیک به مثابه یک مدل یادگیری تقویتی

این روزها صحبتهای زیادی در خصوص یادگیری ماشینی یا همان Machine learning میشنویم، این حوزه به نعمت ظهور پردازنده های قوی تر و سیستم های تواناتر به رشدی شگرف دست یافته است در واقع چندان هم جدید نیست. نظریات پیرامون یادگیری ماشینی و مباحث نظری و ریاضیات پشت پرده آن از سال های دورتر توسعه داده شده بودند اما ظهور Big Data و فناوری های نوین برای محاسبات سنگین پیاده سازی آنها را در ساله ای 2003 امکان پذیر کرد.

در میان شاخه های مختلف یادگیری ماشینی که خود زیر مجموعه ای از هوش مصنوعی است شاخه ای وجود دارد که برای من جذابتر از بقیه است، یادگیری تقویتی یا Reinforcement Learning از حوزه های یادگیری ماشینی است که به صورت ساده می توان آن را ایجاد یک عامل هوشمند که بتواند با تعامل با محیط اطرافش یاد بگیرد و تجربه کسب کند، تعریف کرد. یادگیری تقویتی نیز مانند هوش مصنوعی و دیگر زیر مجموعه هایش از طبیعت اقتباس شده اند. خود هوش مصنوعی محصول نگاهی سیستمی به مقوله های طبیعی و علوم کامپیوتر است که توسط جان هالند(John Holland) به وجود آمد. جان هالند استاد روانشناسی، زیست شناسی و کامپیوتر در دانشگاه بود و با بهره گیری از نگاه سیستمی دیدگاه های مختلف در این سه شاخه علم را بهم مرتبط ساخت اگر بهتر بگوییم رابطه ای پنهان میان سیستهای روانی، زیستی و ماشینی پیدا کرد و این نگاه نوآورانه و البته سیستمی او(که باید بیشتر از پیش مورد توجه قرار گیرد) توانست پایه های هوش مصنوعی و به طور دقیقتر الگوریتمهای ژنتیک را بنا نهد. وی با بهره گیری از مفاهیم ژنتیک و ترکیب ژنها به هنگام تولید مثل نمونه ای الگوریتمیک از این پدیده ی طبیعی را معرفی کرد که ما امروز آن را با نام الگوریتم ژنتیک میشناسیم.