ای ترجمه
ای ترجمه
خواندن ۱۲ دقیقه·۲ سال پیش

مدار مغز برای تصمیم گیری در مورد پستانداران (مقاله ترجمه شده)

مقدمه

مطالعات تجربی در مورد تصمیم ­گیری (در اغلب موارد) به بررسی انتخاب ها با احتمالات و نتایجی که به وضوح تعریف شده ­اند می­پردازد که در آن تصمیم­ گیرندگان گزینه­ هایی را انتخاب می­کنند که برای آن ها عواقبی را در بر دارد. در واقع این امر نشان می­دهد که وظایف تصمیم­ گیری متعارف شامل انتخاب بین شرط­بندی های پولی است، برای مثال ممکن است از شرکت­ کنندگان این پرسش بیان شود که آیا 50 درصد شانس را برای 25 دلار ترجیح می­دهند یا شانس قطعی برای 10 دلار را ترجیح می­دهند.

اگرچه نتایج و احتمالات غالبا پیچیده و نامشخص است و در بعضی مواقع با ابهام همراه است، این تصمیمات معمولا در تنظیمات جداشده اجتماعی قرار می­گیرند. با این حال، در تصمیمات روزمره ما به ندرت در این شرایط قرار می­گیریم، و در حقیقت بسیاری از تصمیمات و انتخاب ها در بستر تعامل اجتماعی گزینش می­شوند. ما زندگی می­کنیم، کار می­کنیم و در محیط بسیار پیچیده اجتماعی بازی می­کنیم، و تصمیماتی که می­گیریم غالبا به تصمیمات دیگران بستگی دارد، برای مثال، زمانی که ما در حال تصمیم ­گیری برای گسترش یک پیشنهاد شغلی هستیم یا زمانی که ما وارد یک مذاکره تجاری می­شویم. این تصمیمات این پتانسیل را دارند که پنجره مفیدی را به داخل اشکال پیچیده تصمیم ­گیری باز کنند، تصمیماتی که تقریبا بسیاری از گزینه ­های جالب را در زندگی واقعی ما انتخاب می­کند. این بخش به بررسی رویکرد اقتصاد عصبی برای مطالعه این مسئله در پستانداران غیر انسانی می­پردازد، که با اندازه­ گیری مستقیم یا دستکاری سیگنال های عصبی در میمون هایی که در چنین تصمیمات اجتماعی درگیر هستند صورت می­گیرد.

ماهیت تصمیم ­گیری ممکن است اساسا هنگامی که نتیجه تصمیم ­گیری به تصمیمات دیگران بستگی دارد تغییر کند، موضوعی که در فصل های 2، 11، 25 و 27 این کتاب نیز آورده شده است. تحت این نوع از شرایط، محاسبه ابزار مورد انتظار استاندارد که بسیاری از نظریه ­های موجود را پایه­ ریزی می­کند و مدل های تصمیم­ گیری توصیف شده در فصل 1 با این حقیقت که ما باید برای فهمیدن اعتقادات شریک یا رقیب خودمان که در تلاش برای رسیدن به تصمیم بهینه است تلاش کنیم را پیچیده کرده است، همانطوری که در فصل 2 نیز به آن اشاره شده است.

تئوری بازی

در اصل، تئوری بازی مجموعه ­ای از مدلهای سختگیرانه با هدف توضیح موقعیت هایی است که در آن تصمیم­ گیرندگان باید با یکدیگر تعامل داشته باشند و این موضوع در فصل 2 این کتاب به تفصیل آمده است. در تئوری بازی کلاسیک (برای مثال، ون نیومن و مورگن اشترن، 1944) فرض بر این است که تصمیم­ گیرندگان دانش کاملی نه تنها در مورد هر کدام از اقدامات متناوبی که می­توانند انتخاب کنند دارند، بلکه همچنین در مورد اینکه چگونه بازپرداخت بطور مشترک با اقدامات آنها و دیگر تصمیم ­گیرندگان تعیین می­شوند نیز مطلع هستند. مفهوم تعادل نقش مهمی را در فهم این تعاملات دارد. برای مثال، مجموعه ­ای از استراتژی ­ها بعنوان تعادل ناش یعنی زمانی که هیچ بازیکن فردی نمی­تواند بازپرداخت را با انحراف از چنین استراتژی هایی بصورت یکطرفه افزایش دهد ارجاع داده می­شوند (ناش، 1950، همچنین فصل 2 را نیز ببینید). بعنوان مثال، اگر دو بازیکن در یک بازی سنگ-کاغذ-قیچی در حال انتخاب از بین سه گزینه غیرقابل پیش­بینی و در نسبتهای مساوی باشند (یک استراتژی مخلوط)، ممکن است در تعادل ناش باشند زیرا هیچکدام از آنها انگیزه ­ای برای تغییر استراتژی خود ندارند. چنین نعادل نظری بازی باعث دقیق شدن مدلهای تصمیم­ گیری انسانی و غیر انسانی خواهد شد، با این حال، تنها تا حدی که تصمیم­ گیرندگان واقعی قادر به ساختن چنین استنتاج های هستند، شناسایی و پیاده ­سازی چنین استراتژی هایی ضروری به نظر می­رسد. در حقیقت، زمانیکه رفتارهای انسان و حیوان در طول بازی های مختلف به صورت سیستماتیک در آزمایشگاه مورد مطالعه قرار می­گیرد، نتایج غالبا انحرافات سیستمی مشابه ی را از پیش ­بینی­ های استراتژیهای تعادل نشان می­دهد (نکته­ای که در فصل قبل و در مطالعه کارمر در سال 2013 مطرح شده است). بطور معمول، تصمیم­ گیرندگان خودخواهی کمتری دارند و بیشتر تمایل به در نظر گرفتن عواملی مانند تقارن و عدالت به جای نظریه بازی کلاسیک دارند (فصل 11). علاوه بر این، زمانیکه همان بازی بصورت مکرر تکرار شود، تصمیم ­گیرندگان تمایل دارند که استراتژیهای خود را به تدریج برای بهبود نتایج انتخاب خود تطبیق دهند. در واقع، انسانها و میمون ها پویایی مشابهی را در رفتارهای انتخابی خود در طول بازی های تکراری نشان می­دهند (لی، 2008)، و این به نحوی است که غالبا در نظریه بازی کلاسیک گنجانده نشده است. با این حال برای خواننده مهم است که در نظر داشته باشد که به رغم این شباهت  های استراتژیک بین گونه ­ها، معلوم نیست که آیا میمون هایی که آزمایشات را در آزمایشگاه ها انجام می­دهند به واقع این را می ­فهمند که آنها در بازی استراتژیک درگیر هستند یا محققان می­توانند برای آنها آموزش کلامی یا دریافت گزارش از آنها را فراهم کنند، زیرا آنها غالبا با یک رقیب زنده در آزمایشگاه مواجه نیستند.

مدار بصری راسته پستانداران غیر انسان بعنوان یک سیستم مدل برای مطالعه پایه عصبی تصمیم­ گیری اجتماعی

با وجود استفاده از بیداری، رفتار میمون­ها یکی از اصلی­ترین سیستم­های تحقیقاتی علوم اعصاب در چهل سال اخیر بوده است و استفاده از آنها در ارتباط با فعالیتهای تئوری بازی کمتر از 10 سال است. اگرچه هنوز در به بلوغ کامل نرسیده است، این تحقیق بینش قابل توجهی را در مورد فرآیندهای پنهانی که در جعبه سیاه در طول تعاملات اجتماعی رخ می­دهند ایجاد کرده است. ما در اینجا روشهای نوروفیزیولوژیک را برای تکنیکهای غیر عصبی معرفی می­کنیم و محدودیتهای آنها را در فراهم آوردن بینشهای آتی برجسته می­سازیم.

مزایا و معایب رویکرد نوروفیزیولوژی سیستم­ها

مزایای رویکرد نوروفیزیولوژی از دسترسی مستقیم به بستر عصبی ناشی می­شود. سیگنالهای عصبی می­توانند با تفکیک­پذیری زمانی (1 میلی ثانیه) و فضایی (نورونهای منفرد) دقیق و با دقت قابل مقایسه نمونه­برداری شوند، فعالیت عصبی می­تواند به صورت مصنوعی دستکاری شود.

انطباق بازی ها برای راسته پستانداران غیر انسانی

عصب­شناسان در ابتدا تلاش خود را بر روی بازیهای با استراتژی مخلوط ساده متمرکز کرده­اند زیرا راسته پستانداران غیر انسان می­تواند بطور نسبی و به آسانی بر روی این فعالیتها آموزش ببینند. سپس ما بطور مختصر برخی از این بازیها را توصیف می­کنیم و اینکه چگونه آنها برای آزمایشگاه عصب اصلاح شده­اند (شکل 26.2).

تجزیه و تحلیل آماری داده ­های بازی تکراری

مزیت نهایی مطالعه تصمیم­گیری اجتماعی در رفتار بیداری میمونها این است که سرمایه و ارزش انتخاب و داده­های عصبی می­توانند از هر بخش از آزمایش جمع­آوری شوند. بطور معمول، میمونها صدها (اگرچه بیش از هزار نمی­شود) آزمایش تکراری را در طول یک بخش آزمایشی منفرد انجام می­دهند. این امر به چند دلیل یک مزیت محسوب می­شود. اول، سیگنالهای عصبی و توالی انتخاب بسیار تصادفی هستند، بنابراین مجموعه داده­های عظیم به شدت برای توسعه ارائه دقیقتر مشارکت نورون در استراتژی انتخاب کلی ارزشمند هستند. دوم، داشتن توالی­های طولانی هر دو سیگنالهای عصبی و الگوهای انتخاب به محقق این اجازه را می­دهد که به بررسی این که چگونه تاریخچه انتخابهای قبلی و نتایج آنها بر روی پردازش آزمایش کنونی تاثیر می­گذارد بپردازد. این به خصوص برای پیگیری چنین عواملی مانند انتخابهای خود شخص و نتایج آنها، انتخابهای رقیب شما و نرخ پاداش کلی در طول تصمیم­گیری اجتماعی حائز اهمیت است. اینها هر دو برای فراهم­سازی تخمینهای دقیق ارزش ذهنی گزینه­ها برای هدایت انتخاب فعلی حیاتی هستند و همچنین برای فرآیند یادگیری و تطبیق رقبا و شرایط پویا نیز ضروری هستند. در نهایت، چنین مجموعه­ داده­های عظیمی به ما این اجازه را می­دهند که مقایسات سختگیرانه­ای از مدلهای آماری مختلف برای فعالیت عصبی و انتخاب انجام دهیم. ما می­توانیم این پرسش را مطرح کنیم که آیا نورون­ها در ناحیه مغزی خاصی متغیرهای خاص پیش­بینی شده توسط مدلهای اقتصادی را نشان می­دهند یا به تعیین اینکه کدام مدلهای رقابتی بهترین توصیف را از یادگیری، رفتار انتخاب و فعالیت عصبی می­پردازند.

آموزش تقویتی

آموزش تقویتی در بازی ها

زمانی که تصمیم­گیرندگان این اجازه را پیدا می­کنند که بارها در بازی خاص تصمیم­گیری کنند و نتایج انتخابهای خود و نیز انتخابهای دیگر بازیکنان را ببینند، رفتارهای آنها می­تواند با مدلهای یادگیری مختلف با دقت بیشتری نسبت به پیش­بینی­های تعادلی تئوری بازی کلاسیک توصیف شود. مدلها در تئوری یادگیری تقویتی با موفقیت توضیحات دقیقی را برای محدوده وسیعی از رفتارهای انتخابی (فصل 15 و 16) شامل آنهایی که در طول تعاملات اجتماعی رخ می­دهند در اختیار قرار می­دهد. تئوری یادگیری تقویتی تعداد زیادی از الگوریتم­های محاسباتی را فراهم می­ساز که می­تواند برای کشف استراتژیهای موفق توسط سعی و خطا استفاده شود. در مقابل استراتژی تعادلی ایستا که توسط رویکردهای اقتصادی سنتی توصیف می­شود، این مدلهای یادگیری پیش­بینی­هایی را در مورد پویایی رفتار انتخابی آزمون به آزمون تولید می­کنند. هدف چنین الگوریتم­هایی این است که مجموع پاداشهای آتی را که معمولا با توجه به تاخیر آنها در نظر گرفته نمی­شوند را به حداقل برساند. شاید این مدلهای پویا که به دنبال به حداقل رساندن پاداش هستند، غالبا به سمت یک تقریب تعادلی ناش تحت برخی شرایط همگرایی داشته باشند.

مکانیک قشری یادگیری تقویتی در طول بازی های تکراری

فعالیت عصبی مربوط به مقادیر و انتخاب ها

یکی از نواحی اولیه فرضیه که در ارائه ارزش اهداف بصری در روندی که می­توانند برای انتخاب اقدامات استراتژیک استفاده شوند عبارتست از ناحیه قشر پس سری (LIP). این ناحیه برای مطالعه انتخاب شد زیرا در انتهای جریان پردازش بصری قرار دارد و خروجی­های آن بر نواحی مغز از جمله برنامه­ریزی و حرکات چشم تاثیر می­گذارد. کار قبلی نشان داده بود که این فعالیت در این ناحیه ممکن است اهمیت اهداف بصری را در روندی که بتواند به منابع قابل توجه تخصیص داده شود را رمزگذاری کند و یا بین اهداف حرکتی چشم انتخابی را صورت دهد. یک مطالعه پیشگام که توسط پلات و گلیمچر (1999) انجام شد نشان داد که متغیرهای اقتصادی مهم مانند احتمال و مقدار پاداش بر روی نرخ کارکرد نورون­های LIP تاثیر می­گذارد و یک چارچوب نظزی تصمیم­گیری را برای مطالعه نقش نواحی مغزی در تحولات حسی-حرکتی فراهم می­کند.

فعالیت عصبی مرتبط با نتایج ساختگی (فکری)

تحلیلهای داده­های رفتاری حاصل از آزمایش سنگ-کاغذ-قیچی که در بالا توصیف شد نشان داده است که نه تنها نتایج واقعی اقدامات انتخابی توسط حیوان، بلکه همچنین نتایج فکری و ساختگی اقدامات انتخاب نشده نیز بر انتخابهای بعدی حیوان تاثیر می­گذارد. برای تعیین اینکه آیا قشر پیشانی در ترکیب هر دو نتایج واقعی و ساختگی در توابع ارزش مختلف دخالت دارد، فعالیت نورون­های منفرد در diPFC و قشر پیشین حدقه­ای در میمون­هایی که در حال بازی سنگ-کاغذ-قیچی بودند ثبت شد. مطابق با یافته­های حاصل از مطالعات قبلی، نتایج این مطالعه نشان داد که نورون­ها در diPFC و OFC غالبا نتایج واقعی را از انتخابهای حیوان رمزگذاری می­کنند. فعالیت مربوط به نتیجه واقعی غالبا در طول دوره بازخورد که در آن اطلاعات در مورد نتیجه واقعی حاصل از هدف انتخابی و نتایج ساختگی حاصل از هدف انتخاب نشده برای حیوان مشخص شد ملاحظه گردید (شکل 26.2). برای مثال، نورون OFC نشان داده شده در شکل 26.7، فعالیت خود را با افزایش دادن پاداش کسب شده توسط حیوان در طول دوره بازخورد آزمونهایی که با پیروزی همراه بودند افزایش داد. نورون­ها در هر دو diPFC و OFC نیز نتایج حاصل از اقدامات خاص را رمزگذاری کردند. برای مثال، برخی از نورون­ها فعالیت خود را مطابق با نتایج حاصل از انتخاب سنگ تغییر دادند، در حالیکه دیگر نورون­ها فعالیت خود را مطابق با نتایج حاصل از انتخاب کاغذ مدوله کردند. این گرایش در diPFC قویتر از OFC بود، که نشان دهنده این است که ممکن است diPFC نقش مهمتری را در به روز کردن توابع ارزش داشته باشد.

نتیجه ­گیری

این فصل پیشرفتهای مهمی را که در فهم مدارهای عصبی تصمیم­گیری اجتماعی دخیل هستند را با ترکیب تکنیکهای نوروفیزیولوژیکی در راسته پستانداران غیر انسان با فعالیتهای میکرواقتصادی و تحلیلهای آماری صورت گرفته است را نشان داده است. تکنیکهای تهاجمی استفاده شده در پستانداران غیر انسان به فعالیت عصبی این اجازه را می­دهد که با تفکیک ­پذیری فضایی و زمانی بالایی و بصورت همبسته با مراحل خاصی از بازی، رفتار و پارامترهای مدلهای یادگیری ثبت شود. علاوه بر این، قابلیت الگوهای محلی فعالیتهای عصبی در بازی می­تواند از طریق دستکاری مصنوعی بررسی شود. این تکنیکها به محققان این اجازه را داده است که ساختارهای پیشانی، عقده­های قاعده­ای و ناحیه بصری مغز را که برای تصمیم­گیری اجتماعی ضرورت دارند، شناسایی کنند. این امر با تحلیل سیگنالهای رفتاری و عصبی در چارچوب مدلهای یادگیری محقق شده است. این به ما اجازه می­دهد که مکانیسم­ها را با ارزش موارد ارائه شده طبق انتخابهای قبلی حیوان و نتایج آنها و نیز نحوه انتخاب آنها در اساس آزمون به آزمون درک کنیم.

هنگامی که آمارهای مهم انتخابها و نتایج در طول بازی خاصی محاسبه می­شوند و مقادیر مختلفی از مدلهای یادگیری در قشر پیشانی به روز می­شوند، انتخاب واقعی و اجرای انتخاب باید صورت بگیرد. شواهد نشان می­دهد که رقابتی بین جمعیتهای عصبی در نواحی پیش­حرکتی مغز (FEF و SC برای حرکات چشم) وجود دارد که اقدامات در اختیار را ارائه می­دهد. بطور معمول، فعالیت در یک جمعیت برای غلبه بر دیگر جمعیتها آغاز می­شود، زمانی که سطح آستانه فعالسازی فرا می­رسد، یک انتخاب یا حرکت صورت می­گیرد. به نظر می­رسد که رقابت مشابهی برای تصمیمات صرفا ادراکی در جاییکه آستانه عمل تحت تاثیر کیفیت اطلاعات حسی قرار می­گیرد، رخ می­دهد. برای تصمیمات اجتماعی، رقابت توسط عوامل اقتصادی مانند ارزش هدف، تاریخچه انتخابهای گذشته و نتایج آنها و حتی اطلاعات ساختگی در مورد اینکه چه نتایجی می­تواند با خود داشته باشد، شکل گرفته است. اگرچه کار بیشتری باید انجام شود، آمارهای با درجه بالاتر و پارامترهای یادگیری رمزگذاری شده در شبکه­های پیشانی آهیانه­ای برای شکل دادن به رقابت در نقشه­های سازمان یافته فضایی اقدامات بالقوه مانند آنهایی که در FEF و SC به نفع انتخاب با بیشترین ارزش برای انتخابگر گرایش دارند، ظاهر می­شود. این حقیقت که مدارهای عصبی ذاتا شلوغ هستند، ممکن است برای تصمیم­گیری اجتماعی مفید واقع شود؛ می­تواند منبعی از بخت و اقبال باشد که این اطمینان را بدهد که با ارزشترین اقدام احتمال بیشتری دارد (اما قطعی نیست) که رخ بدهد. بنابراین، ممکن است مدارهای مغز ما برای تصمیم­گیری اجتماعی در جهت بهره­برداری از گزینه­های با بیشترین ارزش در طول بازی و در زمان تزریق برخی از تصادفات برای جلوگیری رقیب از بهره­مندی ما طراحی شده باشند.

این مقاله در سال 2014 در نشریه الزویر و در مجله اقتصاد عصبی منتشر شده و در سایت ای ترجمه جهت دانلود ارائه شده است. در صورت نیاز به دانلود رایگان اصل مقاله انگلیسی و ترجمه آن می توانید به پست دانلود ترجمه مقاله مدار مغز برای تصمیم گیری در مورد پستانداران در سایت ای ترجمه مراجعه نمایید.

مقاله مدار مغزمقاله تصمیم گیریمقاله پستانداران غیر انسانمقاله یادگیری تقویتیمقاله تئوری بازی
خدمات ارائه مقالات علمی و سفارش ترجمه تخصصی
شاید از این پست‌ها خوشتان بیاید