من ربات ترجمیار هستم و خلاصه مقالات علمی رو به صورت خودکار ترجمه میکنم. متن کامل مقالات رو میتونین به صورت ترجمه شده از لینکی که در پایین پست قرار میگیره بخونین
ریاضیات نمادین در نهایت به شبکههای عصبی منجر میشود
منتشرشده در QuantaMagazine به تاریخ ۲۰ می ۲۰۲۰
لینک مقاله اصلی: Symbolic Mathematics Finally Yields to Neural Networks
بیش از ۷۰ سال پیش، محققان در خط مقدم تحقیقات هوش مصنوعی، شبکههای عصبی را به عنوان یک روش انقلابی برای تفکر در مورد نحوه کار مغز معرفی کردند. در مغز انسان، شبکههای میلیاردها نورون متصل به هم، دادههای حسی را ایجاد میکنند که به ما اجازه میدهد از تجربه درس بگیریم. شبکههای عصبی مصنوعی همچنین میتوانند حجم عظیمی از دادهها را از طریق لایههای متصل به هم فیلتر کنند تا با دنبال کردن قوانینی که خودشان به خودشان آموزش دادهاند، پیشبینی کرده و الگوها را تشخیص دهند.
تا به حال، مردم با شبکههای عصبی به عنوان یک نوع راهحل برای حل چالشهای فنی که میتوانند به عنوان مشکل تشخیص الگو جایگزین شوند، برخورد میکنند. آنها ترجمه زبان طبیعی را فراهم میکنند. برنامههای عکاسی از آنها برای تشخیص و طبقهبندی چهرههایی که در مجموعه شما ظاهر شدهاند استفاده میکنند. و برنامههایی که توسط شبکههای عصبی اجرا میشوند بهترین بازیکنان جهان را در بازیهایی مثل شطرنج شکست دادهاند.
با این حال، شبکههای عصبی همیشه در یک حوزه آشکار تاخیر داشتهاند: حل مسائل دشوار نمادین ریاضی. این مسائل شامل نشانههای دورههای حساب دیفرانسیل مانند انتگرال یا معادلات دیفرانسیل معمولی هستند. ماهیت ریاضیات است که نیازمند راهحلهای دقیق است باعث این موانع میشود.
در عوض شبکههای عصبی احتمالا در احتمالات برتری دارند.
آنها یاد میگیرند که الگوها را تشخیص دهند-کدام ترجمه اسپانیایی بهتر به نظر میرسد، یا صورت شما چه شکلی است-و میتوانند الگوهای جدیدی ایجاد کنند.
این وضعیت در اواخر سال گذشته و زمانی که گیوم لامپل و فرانسوا چارتون، یک جفت از دانشمندان علوم کامپیوتر که در گروه تحقیقاتی هوش مصنوعی فیس بوک در پاریس کار میکردند، از یک رویکرد موفق برای حل مشکلات نمادین ریاضی با شبکههای عصبی پرده برداشتند، تغییر کرد. روش آنها شامل خرد کردن اعداد یا تقریبهای عددی نبود. در عوض، آنها با نقاط قوت شبکههای عصبی بازی کردند، و مسائل ریاضی را به مسائلی که عملا حل شده هستند، تغییر شکل دادند: ترجمه زبان.
چارتون که کاربردهای هوش مصنوعی را در ریاضیات مطالعه میکند گفت: «ما هر دو در ریاضی و آمار ماهر هستیم. ریاضی زبان اصلی ما بود.»
در نتیجه، برنامه لامپل و چارتون میتواند راهحلهای دقیقی برای انتگرالهای پیچیده و معادلات دیفرانسیل تولید کند - از جمله برخی از آنها که بستههای نرمافزارهای معروف ریاضی را با قوانین صریح حل مساله که در آن ساخته شدهاند از کار میاندازد.
برنامه جدید از یکی از مزایای عمده شبکههای عصبی بهره میبرد: آنها قوانین ضمنی خود را توسعه میدهند. در نتیجه، جی مک کللند، روانشناس دانشگاه استنفورد که از شبکههای عصبی برای مدل کردن نحوه یادگیری ریاضی افراد استفاده میکند، گفت: « هیچ جدایی بین قوانین و استثناها وجود ندارد.» در عمل، این بدان معناست که برنامه در حل سختترین انتگرالها دچار مشکل نشد. در نظریه، این نوع رویکرد میتواند «قوانین» غیر متعارف را استنتاج کند که میتواند در مسائلی که در حال حاضر، توسط یک شخص یا یک ماشین، قابلحل نیستند، پیشروی کند؛ مسائل ریاضی مانند کشف ادله جدید، یا درک ماهیت خود شبکههای عصبی.
البته هنوز این اتفاق نیفتاده. اما روشن است که این تیم به این پرسش چند دههای پاسخ دادهاست که آیا هوش مصنوعی میتواند ریاضی نمادین را حل کند؟ بله. Wojciech Zaremba، همبنیانگذار گروه تحقیقاتی هوش مصنوعی OpenAI گفت: مدلهای آنها به خوبی ایجاد شدهاند. الگوریتم ها به خوبی تثبیت شدهاند. آنها این مشکل را به شیوهای هوشمندانه زیر سوال میبرند.
مک کللاند گفت: «آنها موفق به ایجاد شبکههای عصبی شدند که میتوانستند مشکلاتی فراتر از محدوده سیستم ماشینی قانون محور را حل کنند. که بسیار هیجانانگیز است.»
آموزش به یک کامپیوتر برای صحبت به زبان ریاضی
کامپیوترها همیشه در خرد کردن اعداد خوب بودهاند. سیستمهای جبر کامپیوتر دهها یا صدها الگوریتم را با دستورالعملهای از پیش تعیینشده ترکیب میکنند. آنها معمولا پیرو قانون سخت گیرانهای هستند که برای انجام یک عملیات خاص طراحی شدهاند اما قادر به پذیرش استثناها نیستند. برای بسیاری از مسائل نمادین، آنها راهحلهای عددی تولید میکنند که برای کاربردهای مهندسی و فیزیک به اندازه کافی نزدیک و صحیح هستند.
شبکههای عصبی متفاوتند. آنها قوانین سفت و سختی ندارند. در عوض، روی مجموعه دادههای بزرگ آموزش میبینند -هر چه بزرگتر باشد بهتر است- و از آمار برای تقریب زدن بسیار خوب استفاده میکنند. در این فرآیند، آنها یاد میگیرند که چه چیزی بهترین نتایج را ایجاد میکند. برنامههای ترجمه زبان به ویژه در حال درخشش هستند: آنها به جای ترجمه کلمه به کلمه، عبارات را در زمینه کل متن ترجمه میکنند. محققان فیس بوک این موضوع را به عنوان یک مزیت برای حل مسائل نمادین ریاضی دیدند، نه یک مانع. این به برنامه نوعی آزادی در حل مساله میدهد.
این آزادی به ویژه برای برخی مسائل با پایان باز مانند انتگرالگیری مفید است. یک گفته قدیمی در میان ریاضیدانان وجود دارد: «دیفرانسیل مکانیک است؛ انتگرال هنر است» یعنی برای پیدا کردن مشتق یک تابع، شما فقط باید مراحل مشخصی را دنبال کنید. اما پیدا کردن یک انتگرال اغلب به چیز دیگری نیاز دارد، چیزی که به شهود نزدیکتر است تا محاسبه.
گروه فیس بوک مشکوک بود که این حدس میتواند با استفاده از تشخیص الگو تقریب زده شود یا خیر. چارتون گفت: «انتگرالگیری یکی از مشکلات شناسایی الگو در ریاضی است.» بنابراین حتی اگر شبکه عصبی نفهمد که توابع چه کاری انجام میدهند یا چه متغیرهایی چه معنایی دارند، آنها نوعی غریزه را ایجاد میکنند. شبکه عصبی شروع به درک این میکند که چه چیزی جواب میدهد، حتی بدون این که علت آن را بداند.
به عنوان مثال، یک ریاضیدان از او خواست تا انتگرال یک عبارت مانند yy'(y^2+1)^-1/2 را ببگیرد و به طور مستقیم حدس بزند که عبارت ابتدایی-یعنی، بیانی که برای ایجاد انتگرال متمایز شدهاست-شامل چیزی است که شبیه ریشه دوم y^2+1 است.
برای اجازه دادن به یک شبکه عصبی برای پردازش نمادها مانند یک ریاضیدان، شارتون و لامپل با تبدیل عبارات ریاضی به شکلهای مفیدتر شروع شد. آنها در نهایت آنها را به عنوان درخت تفسیر کردند-فرمتی مشابه با یک جمله نمودارشده. عملگرهای ریاضی مانند جمع، تفریق، ضرب و تقسیم به دو شاخه درخت تبدیل میشوند؛ همچنین عملیاتهایی مانند به توان رساندن یا توابع مثلثاتی. بحثها (متغیرها و اعداد) به برگ تبدیل شدند. ساختار درخت، با چند استثنا، روشی را که عملیات میتواند در داخل عبارات طولانیتر تودرتو باشد، بدست میآورد.
لامپل گفت: «وقتی ما یک تابع بزرگ را میبینیم، میتوانیم ببینیم که این تابع از توابع کوچکتر تشکیلشده و درکی در مورد این که راهحل چه میتواند باشد، داریم. ما فکر میکنیم که این مدل سعی در پیدا کردن سرنخهایی در این نشانهها دارد که راهحل چه میتواند باشد». او گفت که این روند به موازات این است که مردم چطور انتگرالها-و واقعا همه مشکلات ریاضی-را از طریق کاهش آنها به مشکلات فرعی قابلتشخیص که قبلا حل کردهاند، حل میکنند.
این متن با استفاده از ربات ترجمه مقاله علمی ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه میتواند دارای برخی اشکالات ترجمه باشد.
مطلبی دیگر از این انتشارات
بهترین سیستمعامل برای برنامهنویسی
مطلبی دیگر از این انتشارات
دستهبندی ویروسها با یادگیری ماشین
مطلبی دیگر از این انتشارات
۲۳ ایده منحصر به فرد هدیه شرکتی برای تحت تاثیر قرار دادن مشتریان یا کارمندان