چرا معمولا از دیوید مار بهعنوان یکی از چهرههای کلیدی در علوم شناختی یاد میشود؟

دیوید مار یکی از چهرههای مهم علوم شناختی و علوماعصاب محاسباتی به حساب میآید که اسماش با رویکردی عمیقا میانرشتهای گره خورده است. مار در طول عمر کوتاه اما پُربارش، توانست پلی میان علوم اعصاب، علوم رایانه، روانشناسی و فلسفهٔ ذهن بزند و زبان مشترکی برای این حوزهها ارائه کند. مار مغز و ذهن را نه صرفا بهعنوان یک پدیدهٔ زیستی، بلکه بهمثابهٔ سیستمهای پردازش اطلاعات میدید که باید با همان دقت و روششناسیِ مهندسی تحلیل شوند. اهمیت کار مار برای علوم شناختی در این بود که نشان داد فهمِ ذهن، نیازمند همکاری چندین رشتهست؛ از فیزیولوژیِ نورونها و نظریههای بازنمایی گرفته تا الگوریتمهای پردازش تصویر و مدلسازیِ رایانهای. به همین دلیل، دیوید مار بهعنوان نمادِ تلاش میانرشتهای در علوم شناختی باقی مانده، تلاشی که همچنان در بینایی کامپیوتر، علوم اعصاب محاسباتی و مدلسازی شناختی الهامبخش میباشد.
دیوید مار در فصل اوّل کتاب مشهورش Vision: A Computational Investigation into the Human Representation and Processing of Visual Information، که پس از مرگ زودهنگاماش منتشر شد، مینویسد:
«تلاش برای درک ادراک تنها از طریق مطالعهٔ نورونها، مانند تلاش برای درک پرواز پرندگان صرفا از راه مطالعهٔ بالهای آنهاست؛ چنین چیزی بهسادگی ممکن نیست.»
این نگاه به تولد نظریهٔ معروف فرضیهٔ سه سطحی انجامید؛ چهارچوبی که مار نه فقط برای مطالعهٔ بینایی، بلکه برای هر فرآیند یا سیستمِ شناختیِ دیگهای پیشنهاد میکرد: طبق این دیدگاه، ما هر سیستم شناختی و پردازش اطلاعاتی را باید در سه سطح مورد مطالعه و بررسی قرار بدیم؛ سطح محاسباتی (مسئلهای که باید حل شود چیست و چرا باید حل شود؟)، سطح الگوریتمی (این مسئله چهطور باید حل شود؟ با چه بازنماییها و فرآیندها و گامهای پردازشیای باید حل شود؟) و سطح اجرایی (این فرآیند چهطور در سختافزار فیزیکی، مثل مغز یا رایانه، پیادهسازی میشود یا تحقق پیدا میکند؟).
دیوید مار برای مطالعهٔ سیستمهای شناختی یک چهارچوب سهسطحی ارائه داد که در آن، سطح محاسباتی به این میپردازد که سیستم دقیقا چه مسئلهای را حل میکند و چرا این مسئله اهمیت دارد (مثل اینکه هدف بینایی، بازسازی دنیای سهبعدی از ورودیهای سلولهای شبکیه است). سطح الگوریتمی توضیح میدهد این هدف با چه نمادها و بازنماییهایی و با چه الگوریتمها و گامهای پردازشیای انجام میشود (مثل استخراج لبهها، ترکیب ویژگیها و دستهبندی اشیاء). سطح اجرایی مشخص میکند این الگوریتمها در چه ساختار فیزیکی یا زیستی اجرا میشوند و چهطور در این ساختار فیزیکی تحقق پیدا میکنند (مثلا شبکهای از نورونها، مدارهای عصبی یا سختافزار کامپیوتری). بهزعم مار، این سه سطح مکمل همدیگه هستند و بدون در نظر گرفتن هر یک از سه سطح، ما درک کامل و جامعی از یک سیستم شناختی یا پردازش اطلاعات نخواهیم داشت.
آنچه در ادامه میآید، ترجمهٔ بخشهایی از مقدمهٔ کتاب Vision اثر دیوید مار است. انتخاب این متن با این هدف انجام شده که فرصتی برای مواجههٔ مستقیم با یکی از آثار مهم و تأثیرگذار در تاریخ علوم شناختی فراهم شود؛ مواجههای که به جای روایتهای دستدوّم، از خلال خودِ نوشتهها و ایدههای نویسنده شکل میگیرد و امکان درک عمیقتری از فضای فکری و دغدغههای علمی او به دست میدهد.

دیدن یعنی چه؟ پاسخ انسان معمولی (و البته پاسخ ارسطو) چنین خواهد بود: دانستنِ اینکه چه چیزی کجاست، از طریق نگاه کردن. بهعبارت دیگر، بینایی فرآیند کشف این است که از روی تصاویر بفهمیم چه چیزی در جهان حاضر است و در کجا قرار دارد.
بینایی پیش از هر چیز یک وظیفهٔ پردازش اطلاعات است، اما نمیتوان آن را صرفاً یک فرآیند دانست. زیرا اگر ما قادر باشیم بدانیم چه چیزی در جهان کجاست، مغز ما باید بهنحوی تواناییِ بازنمایی این اطلاعات را داشته باشد، با تمام تنوع رنگ و شکل، زیبایی، حرکت و جزئیاتِ آن. پس مطالعهٔ بینایی تنها شامل بررسی چگونگی استخراج جنبههای مختلف جهان از تصاویر که برای ما سودمند هستند نمیشود، بلکه باید پژوهشی هم در ماهیت بازنماییهای درونی صورت گیرد؛ بازنماییهایی که از طریق آنها این اطلاعات را ثبت میکنیم و در نتیجه آن را بهعنوان مبنایی برای تصمیمگیری در مورد افکار و کنشهایمان در دسترس قرار میدهیم. این دوگانگی — بازنمایی و پردازش اطلاعات — در قلب بیشتر وظایف پردازش اطلاعات قرار دارد و بهشکلی عمیق مسیرِ بررسیِ ما دربارۀ مسائلِ ویژهای که بینایی مطرح میکند، شکل خواهد داد.
نیاز به درک وظایف و ماشینهای پردازش اطلاعات، پدیدهای نسبتاً نوظهور است. تا زمانی که انسانها رؤیای ساخت چنین ماشینهایی را در سر نپرورانده و سپس آنها را نساخته بودند، هیچ نیاز فوری و جدی برای اندیشیدن عمیق به این موضوع وجود نداشت. اما بهمحض آنکه اندیشه دربارۀ این وظایف و ماشینها آغاز شد، بهسرعت روشن گردید که بسیاری از جنبههای جهان پیرامون ما میتوانند از منظر پردازش اطلاعات مورد بررسی قرار گیرند. بیشتر پدیدههایی که برای انسانها بنیادی و اساسیاند — از رازهای زندگی و تکامل گرفته تا ادراک، احساس و اندیشه — در اصل، پدیدههایی مرتبط با پردازش اطلاعاتاند؛ و اگر روزی بخواهیم آنها را بهراستی درک کنیم، ناگزیر باید این دیدگاه را در اندیشهی خود بگنجانیم.
نکتۀ بعدی — که باید با اندکی شتاب برای کسانی بیان شود که در جهانی زندگی میکنند که در آن رایانۀ شرکت خدمات عمومی هنوز قادر است صورتحساب نهایی به مبلغ ۰.۰۰ دلار صادر کند — تأکید بر این است که توصیف یک وظیفه بهعنوان «صرفاً» یک کار پردازش اطلاعات یا توصیف یک موجود زنده بهعنوانِ «فقط» یک ماشین پردازش اطلاعات، نه محدودکننده است و نه تحقیرآمیز. از آن مهمتر، من بههیچوجه از چنین توصیفی برای محدود کردن نوع تبیینهاییژ که لازماند استفاده نخواهم کرد. بلکه برعکس، یکی از ویژگیهای جذاب ماشینهای پردازش اطلاعات این است که برای درک کامل آنها، باید بتوانیم توضیحاتی (تبیینهایی) در چند سطحِ مختلف پذیرا باشیم.
برای مثال، بیایید نگاهی بیندازیم به مجموعه دیدگاههایی که باید در نظر گرفته شوند تا بتوان گفت از نظر انسانی و علمی، درک درستی از ادراک بینایی حاصل شده است. نخست، و بهگمان من مهمترین، دیدگاه انسان عادی است. او تجربۀ دیدن را از نزدیک میشناسد، و اگر پایههای استدلالها و نظریههای ما با آنچه این فرد بهطور مستقیم تجربه کرده همخوانی نداشته باشد، احتمالاً اشتباه کردهایم (نکتهای که آستین در سال ۱۹۶۲ با قدرت و ظرافت بیان کرده است). دوم، دیدگاه دانشمندان مغز، فیزیولوژیستها و کالبدشناسهایی است که اطلاعاتِ زیادی دربارۀ ساختار سیستم عصبی و نحوۀ عملکرد بخشهای مختلف آن دارند. مسائلی که برای آنها اهمیت دارد — مثل نحوۀ اتصال سلولها، دلیل واکنشهای خاص آنها، و اصول نورونیِ مطرحشده توسط بارلو در سال ۱۹۷۲ — باید در هر تبیینِ جامع از ادراک مورد بررسی و پاسخ قرار گیرند. و همین منطق در مورد دیدگاه روانشناسان تجربی نیز صدق میکند.
از سوی دیگر، کسی که یک رایانهٔ خانگی کوچک خریده و با آن کار کرده باشد، ممکن است انتظارات کاملاً متفاوتی داشته باشد. او ممکن است بگوید: «اگر بینایی واقعاً یک وظیفهٔ پردازش اطلاعات است، پس باید بتوانم رایانهام را وادار کنم این کار را انجام دهد، بهشرطی که قدرت و حافظهٔ کافی داشته باشد و بتوان بهنوعی آن را به یک دوربین تلویزیونی خانگی وصل کرد.» بنابراین، توضیحی که او میخواهد، توضیحی انتزاعیتر است؛ چیزی که به او بگوید چه برنامهای بنویسد و اگر ممکن باشد، راهنماییای دربارهٔ بهترین الگوریتمها برای انجام این کار. او علاقهای به دانستن دربارهٔ رودوپسین، یا هستهٔ زانویی جانبی، یا اینترنورونهای مهاری ندارد. او فقط میخواهد بداند چطور باید بینایی را برنامهنویسی کند.
نکتهٔ بنیادی این است که برای درک دستگاهی که وظیفهای در پردازش اطلاعات انجام میدهد، به انواع گوناگونی از تبیینها نیاز داریم. بخش نخست این کتاب به همین موضوع میپردازد، و این مسئله جایگاه برجستهای دارد زیرا یکی از سنگبناهای کتاب این است که ما ناچار بودهایم با دقت بیشتری به این بیندیشیم که «تبیین» دقیقاً چه چیزی را شامل میشود؛ بسیار بیشتر از آنچه در دیگر پیشرفتهای علمی اخیر، مانند زیستشناسی مولکولی، لازم بوده است. در موضوع بینایی، هیچ معادله یا دیدگاه یگانهای وجود ندارد که بتواند همهچیز را توضیح دهد. هر مسئله باید از چند منظر بررسی شود: بهعنوان مسئلهای در بازنمایی اطلاعات؛ بهعنوان یک محاسبه که بتواند آن بازنمایی را به دست آورد؛ و بهعنوان مسئلهای در معماری یک رایانه که بتواند هر دو کار را بهسرعت و با اطمینان انجام دهد.
با در نظر داشتن این ویژگی ذاتاً گستردۀ مفهوم تبیین، میتوان از بسیاری از لغزشها دوری کرد. یکی از پیامدهای تأکید بر پردازش اطلاعات، برای نمونه، ممکن است مقایسهٔ مغز انسان با یک رایانه باشد. البته از یک جنبه، مغز رایانه است، اما گفتن این جمله بدون قید و شرط گمراهکننده است، زیرا ماهیت مغز صرفاً این نیست که یک رایانه باشد، بلکه این است که رایانهای است که عادت به انجام برخی محاسبات خاص دارد. اصطلاح «رایانه» معمولاً به ماشینی اطلاق میشود که مجموعهای استاندارد از دستورالعملها دارد که عموماً بهشکل سریالی اجرا میشود، گرچه امروزه گاهی بهصورت موازی نیز اجرا میگردند و همۀ اینها تحت کنترل برنامههایی است که در حافظه ذخیره شدهاند. برای درک چنین رایانهای، باید دانست که از چه ساخته شده، چگونه سرهم شده، مجموعهٔ دستورالعملهایش چیست، چه مقدار حافظه دارد و این حافظه چگونه در دسترس قرار میگیرد، و چگونه میتوان آن را به اجرا درآورد. اما همه اینها تنها بخش کوچکی از درک رایانهای است که در حال انجام وظیفۀ پردازش اطلاعات است.
بیشترِ قیاسها میان مغز و رایانه بیش از حد سطحیاند و چندان سودمند نیستند. برای نمونه، به شبکهٔ بینالمللی رایانههای رزرو پرواز بیندیشید؛ شبکهای که وظیفهٔ تخصیص پروازها برای میلیونها مسافر در سراسر جهان را بر عهده دارد. برای درک این سامانه، دانستن چگونگی کار یک رایانهٔ مدرن بهتنهایی کافی نیست. باید اندکی هم دربارهٔ هواپیماها و کارکردشان دانست؛ دربارهٔ جغرافیا، مناطق زمانی، نرخ بلیتها، نرخ تبدیل ارزها و ارتباطات؛ و نیز چیزهایی دربارهٔ سیاست، رژیمهای غذایی، و جنبههای گوناگون طبیعت انسانی که بهطور خاص به این وظیفه مربوط میشوند.
نکتهٔ حیاتی این است که درک رایانهها متفاوت از درک محاسبات است. برای درک یک رایانه، باید آن رایانه را مطالعه کرد. برای درک یک وظیفهٔ پردازش اطلاعات، باید همان وظیفهٔ پردازش اطلاعات را مطالعه کرد. برای درک کامل یک ماشین خاص که وظیفهٔ پردازشِ اطلاعاتِ خاصی را انجام میدهد، باید هر دو کار را انجام داد. هیچکدام به تنهایی کافی نخواهد بود.
از دیدگاه فلسفی، رویکردی که در اینجا توصیف میشود، امتدادی از آن چیزی است که گاه به آن نظریههای بازنمودی ذهن گفته میشود. این رویکرد گرایشهای تازهتر در فلسفه ادراک را که با استدلالهایشان درباره دادههای حسی، مولکولهای ادراک و اعتبار آنچه حواس به ما منتقل میکنند سر و کار دارند، رد میکند؛ در عوض، این رویکرد به دیدگاه کهنتری بازمیگردد که بر اساس آن، کارکرد اصلی حواس، در بیشتر موارد، اطلاع دادن از آن چیزی است که در جهان بیرونی وجود دارد. نظریههای بازنمودی مدرن، ذهن را واجد دسترسی به نظامهایی از بازنماییهای درونی میدانند؛ بهگونهای که حالات ذهنی بر اساس آنچه این بازنماییهای درونی در لحظه بیان میکنند، تعریف میشوند، و فرآیندهای ذهنی نیز بر پایهٔ نحوهٔ دستیابی به این بازنماییها و چگونگیِ تعامل آنها با یکدیگر توصیف میگردند.
این طرح، چهارچوبی مناسب و منسجم برای کاوش در ادراک بصری فراهم میکند، و من با رضایتی درونی آن را نقطهٔ عزیمت این سیر اندیشه قرار میدهم. اما همانگونه که در ادامه خواهیم دید، این مسیر ما را از جادههای آشنا و سنتی دور کرده و به سرزمینی نو در قلمرو اندیشه خواهد برد؛ جایی که برخی از کشفیات، غریب مینمایند و آشتی دادن آنها با تجربهٔ درونیِ دیدن و نگریستن، دشوار خواهد بود. حتی مفهومِ بنیادینِ «تبیین» نیز نیازمند بازتعریف و گسترش خواهد بود تا هیچ منظر مهمی از مسئله مغفول نماند و همهٔ دیدگاههای اساسی، پاسخ داده شده یا دستکم قابل پاسخگویی باشند.