ریاضیات نمادین در نهایت به شبکه‌های عصبی منجر می‌شود

منتشرشده در QuantaMagazine به تاریخ ۲۰ می ۲۰۲۰
لینک مقاله اصلی: Symbolic Mathematics Finally Yields to Neural Networks

بیش از ۷۰ سال پیش، محققان در خط مقدم تحقیقات هوش مصنوعی، شبکه‌های عصبی را به عنوان یک روش انقلابی برای تفکر در مورد نحوه کار مغز معرفی کردند. در مغز انسان، شبکه‌های میلیاردها نورون متصل به هم، داده‌های حسی را ایجاد می‌کنند که به ما اجازه می‌دهد از تجربه درس بگیریم. شبکه‌های عصبی مصنوعی همچنین می‌توانند حجم عظیمی از داده‌ها را از طریق لایه‌های متصل به هم فیلتر کنند تا با دنبال کردن قوانینی که خودشان به خودشان آموزش داده‌اند، پیش‌بینی کرده و الگوها را تشخیص دهند.

تا به حال، مردم با شبکه‌های عصبی به عنوان یک نوع راه‌حل برای حل چالش‌های فنی که می‌توانند به عنوان مشکل تشخیص الگو جایگزین شوند، برخورد می‌کنند. آن‌ها ترجمه زبان طبیعی را فراهم می‌کنند. برنامه‌های عکاسی از آن‌ها برای تشخیص و طبقه‌بندی چهره‌هایی که در مجموعه شما ظاهر شده‌اند استفاده می‌کنند. و برنامه‌هایی که توسط شبکه‌های عصبی اجرا می‌شوند بهترین بازیکنان جهان را در بازی‌هایی مثل شطرنج شکست داده‌اند.

با این حال، شبکه‌های عصبی همیشه در یک حوزه آشکار تاخیر داشته‌اند: حل مسائل دشوار نمادین ریاضی. این مسائل شامل نشانه‌های دوره‌های حساب دیفرانسیل مانند انتگرال یا معادلات دیفرانسیل معمولی هستند. ماهیت ریاضیات است که نیازمند راه‌حل‌های دقیق است باعث این موانع می‌شود.

در عوض شبکه‌های عصبی احتمالا در احتمالات برتری دارند.

آن‌ها یاد می‌گیرند که الگوها را تشخیص دهند-کدام ترجمه اسپانیایی بهتر به نظر می‌رسد، یا صورت شما چه شکلی است-و می‌توانند الگوهای جدیدی ایجاد کنند.

این وضعیت در اواخر سال گذشته و زمانی که گیوم لامپل و فرانسوا چارتون، یک جفت از دانشمندان علوم کامپیوتر که در گروه تحقیقاتی هوش مصنوعی فیس بوک در پاریس کار می‌کردند، از یک رویکرد موفق برای حل مشکلات نمادین ریاضی با شبکه‌های عصبی پرده برداشتند، تغییر کرد. روش آن‌ها شامل خرد کردن اعداد یا تقریب‌های عددی نبود. در عوض، آن‌ها با نقاط قوت شبکه‌های عصبی بازی کردند، و مسائل ریاضی را به مسائلی که عملا حل شده‌ هستند، تغییر شکل دادند: ترجمه زبان.

چارتون که کاربردهای هوش مصنوعی را در ریاضیات مطالعه می‌کند گفت: «ما هر دو در ریاضی و آمار ماهر هستیم. ریاضی زبان اصلی ما بود.»

در نتیجه، برنامه لامپل و چارتون می‌تواند راه‌حل‌های دقیقی برای انتگرال‌های پیچیده و معادلات دیفرانسیل تولید کند - از جمله برخی از آن‌ها که بسته‌های نرم‌افزارهای معروف ریاضی را با قوانین صریح حل مساله که در آن ساخته شده‌اند از کار می‌اندازد.

برنامه جدید از یکی از مزایای عمده شبکه‌های عصبی بهره می‌برد: آن‌ها قوانین ضمنی خود را توسعه می‌دهند. در نتیجه، جی مک کللند، روانشناس دانشگاه استنفورد که از شبکه‌های عصبی برای مدل کردن نحوه یادگیری ریاضی افراد استفاده می‌کند، گفت: « هیچ جدایی بین قوانین و استثناها وجود ندارد.» در عمل، این بدان معناست که برنامه در حل سخت‌ترین انتگرال‌ها دچار مشکل نشد. در نظریه، این نوع رویکرد می‌تواند «قوانین» غیر متعارف را استنتاج کند که می‌تواند در مسائلی که در حال حاضر، توسط یک شخص یا یک ماشین، قابل‌حل نیستند، پیشروی کند؛ مسائل ریاضی مانند کشف ادله جدید، یا درک ماهیت خود شبکه‌های عصبی.

البته هنوز این اتفاق نیفتاده. اما روشن است که این تیم به این پرسش چند دهه‌ای پاسخ داده‌است که آیا هوش مصنوعی می‌تواند ریاضی نمادین را حل کند؟ بله. Wojciech Zaremba، هم‌بنیانگذار گروه تحقیقاتی هوش مصنوعی OpenAI گفت: مدل‌های آن‌ها به خوبی ایجاد شده‌اند. الگوریتم ها به خوبی تثبیت شده‌اند. آن‌ها این مشکل را به شیوه‌ای هوشمندانه زیر سوال می‌برند.

مک کللاند گفت: «آن‌ها موفق به ایجاد شبکه‌های عصبی شدند که می‌توانستند مشکلاتی فراتر از محدوده سیستم ماشینی قانون محور  را حل کنند. که بسیار هیجان‌انگیز است.»

آموزش به یک کامپیوتر برای صحبت به زبان ریاضی

کامپیوترها همیشه در خرد کردن اعداد خوب بوده‌اند. سیستم‌های جبر کامپیوتر ده‌ها یا صدها الگوریتم را با دستورالعمل‌های از پیش تعیین‌شده ترکیب می‌کنند. آن‌ها معمولا پیرو قانون سخت گیرانه‌ای هستند که برای انجام یک عملیات خاص طراحی شده‌اند اما قادر به پذیرش استثناها نیستند. برای بسیاری از مسائل نمادین، آن‌ها راه‌حل‌های عددی تولید می‌کنند که برای کاربردهای مهندسی و فیزیک به اندازه کافی نزدیک و صحیح هستند.

شبکه‌های عصبی متفاوتند. آن‌ها قوانین سفت و سختی ندارند. در عوض، روی مجموعه داده‌های بزرگ آموزش می‌بینند -هر چه بزرگ‌تر باشد بهتر است- و از آمار برای تقریب زدن بسیار خوب استفاده می‌کنند. در این فرآیند، آن‌ها یاد می‌گیرند که چه چیزی بهترین نتایج را ایجاد می‌کند. برنامه‌های ترجمه زبان به ویژه در حال درخشش هستند: آن‌ها به جای ترجمه کلمه به کلمه، عبارات را در زمینه کل متن ترجمه می‌کنند. محققان فیس بوک این موضوع را به عنوان یک مزیت برای حل مسائل نمادین ریاضی دیدند، نه یک مانع. این به برنامه نوعی آزادی در حل مساله می‌دهد.

این آزادی به ویژه برای برخی مسائل با پایان باز مانند انتگرال‌گیری مفید است. یک گفته قدیمی در میان ریاضی‌دانان وجود دارد: «دیفرانسیل مکانیک است؛ انتگرال هنر است» یعنی برای پیدا کردن مشتق یک تابع، شما فقط باید مراحل مشخصی را دنبال کنید. اما پیدا کردن یک انتگرال اغلب به چیز دیگری نیاز دارد، چیزی که به شهود نزدیک‌تر است تا محاسبه.

گروه فیس بوک مشکوک بود که این حدس می‌تواند با استفاده از تشخیص الگو تقریب زده شود یا خیر. چارتون گفت: «انتگرال‌گیری یکی از مشکلات شناسایی الگو در ریاضی است.» بنابراین حتی اگر شبکه عصبی نفهمد که توابع چه کاری انجام می‌دهند یا چه متغیرهایی چه معنایی دارند، آن‌ها نوعی غریزه را ایجاد می‌کنند. شبکه عصبی شروع به درک این می‌کند که چه چیزی جواب می‌دهد، حتی بدون این که علت آن را بداند.

به عنوان مثال، یک ریاضیدان از او خواست تا انتگرال یک عبارت مانند yy'(y^2+1)^-1/2 را ببگیرد و به طور مستقیم حدس بزند که عبارت ابتدایی-یعنی، بیانی که برای ایجاد انتگرال متمایز شده‌است-شامل چیزی است که شبیه ریشه دوم y^2+1 است.

برای اجازه دادن به یک شبکه عصبی برای پردازش نمادها مانند یک ریاضیدان، شارتون و لامپل با تبدیل عبارات ریاضی به شکل‌های مفیدتر شروع شد. آن‌ها در نهایت آن‌ها را به عنوان درخت تفسیر کردند-فرمتی مشابه با یک جمله نمودارشده. عملگرهای ریاضی مانند جمع، تفریق، ضرب و تقسیم به دو شاخه درخت تبدیل می‌شوند؛ همچنین عملیات‌هایی مانند به توان رساندن یا توابع مثلثاتی. بحث‌ها (متغیرها و اعداد) به برگ تبدیل شدند. ساختار درخت، با چند استثنا، روشی را که عملیات می‌تواند در داخل عبارات طولانی‌تر تودرتو باشد، بدست می‌آورد.

لامپل گفت: «وقتی ما یک تابع بزرگ را می‌بینیم، می‌توانیم ببینیم که این تابع از توابع کوچک‌تر تشکیل‌شده و درکی در مورد این که راه‌حل چه می‌تواند باشد، داریم. ما فکر می‌کنیم که این مدل سعی در پیدا کردن سرنخ‌هایی در این نشانه‌ها دارد که راه‌حل چه می‌تواند باشد». او گفت که این روند به موازات این است که مردم چطور انتگرال‌ها-و واقعا همه مشکلات ریاضی-را از طریق کاهش آن‌ها به مشکلات فرعی قابل‌تشخیص که قبلا حل کرده‌اند، حل می‌کنند.

این متن با استفاده از ربات ترجمه مقاله علمی ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.