دانشمندان MIT کشف کردند که کامپیوترها می‌توانند کلمات و مفاهیم پیچیده را درک کنند

شکل ۱. آن‌ها کشف کردند که سیستم هوش‌مصنوعی که آن‌ها به آن نگاه کردند، معانی کلمات را به شیوه‌ای بیان می‌کند که شباهت زیادی به قضاوت انسان دارد.
شکل ۱. آن‌ها کشف کردند که سیستم هوش‌مصنوعی که آن‌ها به آن نگاه کردند، معانی کلمات را به شیوه‌ای بیان می‌کند که شباهت زیادی به قضاوت انسان دارد.
منتشر شده در scitechdaily به تاریخ ۲۴ جولای، ۲۰۲۲
لینک منبع: MIT Scientists Discover That Computers Can Understand Complex Words and Concepts

مدل‌های پردازش زبان طبیعی از آمار برای جمع‌آوری اطلاعات زیادی در مورد معانی کلمات استفاده می‌کنند.

در کتاب «Through the Looking Glass»، با تمسخر می‌گوید، «وقتی از یک کلمه استفاده می‌کنم، دقیقاً به معنای آن چیزی است که انتخاب می‌کنم -نه بیشتر و نه کم‌تر.»

معانی کلمه از دیرباز موضوع تحقیق بوده‌اند. برای درک معنای آن‌ها، ذهن انسان باید از طریق یک شبکه پیچیده از اطلاعات انعطاف‌پذیر و دقیق طبقه‌بندی شود.

در حال حاضر، یک موضوع جدیدتر با معنی کلمه روشن شده‌است. محققان به دنبال این هستند که آیا ماشین‌هایی با هوش‌مصنوعی می‌توانند فرآیندهای فکری انسان را تقلید کنند و کلمات را به‌طور مشابه درک کنند. محققان از UCLA، موسسه ملی بهداشت و MIT اخیرا مطالعه‌ای را منتشر کرده‌اند که به این سوال پاسخ می‌دهد.

این مطالعه، که در مجله Nature Human Behaviour منتشر شد، نشان می‌دهد که سیستم‌های هوش‌مصنوعی ممکن است واقعا معانی کلمات بسیار پیچیده را دریافت کنند. محققان همچنین یک روش ساده برای به دست آوردن دسترسی به این اطلاعات پیچیده یافتند. آن‌ها کشف کردند که سیستم هوش‌مصنوعی که آن‌ها به آن نگاه کردند، معانی کلمه را به شیوه‌ای نشان می‌دهد که شباهت نزدیکی به قضاوت انسان دارد.

سیستم AI بررسی شده توسط نویسندگان به‌طور گسترده‌ای برای تجزیه‌وتحلیل معنی کلمه در طول دهه گذشته مورد استفاده قرار گرفته‌است. با خواندن مقادیر عظیمی از مطالب در اینترنت که حاوی ده‌ها میلیارد کلمه است، معانی کلمات را به دست می‌آورد.

تصویری از فرافکنی معنایی، که می‌تواند شباهت بین دو کلمه را در یک زمینه خاص تعیین کند. این شبکه نشان می‌دهد که حیوانات خاص تا چه اندازه به هم شبیه هستند.

وقتی کلمات اغلب با هم اتفاق می‌آیند -مثلا «میز» و «صندلی»- سیستم یاد می‌گیرد که معانی آن‌ها به هم مرتبط هستند. و اگر جفتی از کلمات به‌ندرت با هم بیایند --مانند «میز» و «سیاره»-- سیستم یاد می‌گیرد که آن‌ها معانی بسیار متفاوتی دارند.

این رویکرد مانند یک نقطه شروع منطقی به نظر می‌رسد، اما در نظر بگیرید که انسان‌ها چقدر خوب جهان را درک خواهند کرد اگر تنها راه برای درک معنا این باشد که بدانیم کلمات چقدر در نزدیکی یکدیگر رخ می‌دهند، بدون اینکه توانایی تعامل با دیگران و محیط ما را داشته باشند.

ایدان بلانک، استادیار روانشناسی و زبان‌شناسی UCLA، و نویسنده مشترک این تحقیق، گفت که محققان تصمیم گرفتند تا آنچه سیستم درباره کلماتی که یاد می‌گیرد می‌داند و اینکه چه نوع «حس مشترک» دارد را یاد بگیرند.

پیش از شروع تحقیقات، بلانک گفت، به نظر می‌رسد که این سیستم یک محدودیت عمده دارد: «تا جایی که به سیستم مربوط می‌شود، هر دو کلمه تنها یک مقدار عددی دارند که نشان‌دهنده شباهت آن‌ها است.»

در مقابل، دانش انسانی بسیار دقیق‌تر و پیچیده‌تر است.

بلانک گفت: «دانش ما از دلفین‌ها و تمساح‌ها را در نظر بگیرید.» وقتی ما این دو را در یک مقیاس اندازه مقایسه می‌کنیم، از «کوچک» تا «بزرگ»، آن‌ها نسبتا شبیه هم هستند. از نظر هوش، آن‌ها تا حدودی متفاوت هستند. از نظر خطری که آن‌ها برای ما ایجاد می‌کنند، در مقیاسی از «ایمن» تا «خطرناک»، آن‌ها تا حد زیادی متفاوت هستند. بنابراین معنای یک کلمه به زمینه بستگی دارد.

«می‌خواستیم بپرسیم که آیا این سیستم واقعا این تفاوت‌های ظریف را می‌داند -آیا ایده شباهت آن به همان روشی که برای انسان‌ها انعطاف‌پذیر است، یا خیر.»

برای پی بردن به این موضوع، نویسندگان تکنیکی را توسعه دادند که آن را «طرح معنایی» می‌نامند. برای مثال، می‌توان بین نمایش‌های مدل از کلمات «بزرگ» و «کوچک» خطی کشید و دید که نمایش‌های حیوانات مختلف بر روی آن خط قرار می‌گیرند.

دانشمندان با استفاده از این روش، گروه‌های ۵۲ کلمه‌ای را مورد مطالعه قرار دادند تا ببینند آیا این سیستم می‌تواند یاد بگیرد که چگونه معانی را طبقه‌بندی کند -مانند قضاوت درباره حیوانات با توجه به اندازه آن‌ها یا اینکه چقدر برای انسان‌ها خطرناک هستند، یا طبقه‌بندی ایالات‌متحده با توجه به آب‌ووا یا ثروت کلی.

در میان گروه‌بندی‌های دیگر واژه‌ها، اصطلاحات مربوط به لباس، حرفه، ورزش، موجودات اساطیری و نام‌ها بود. برای مثال، چندین زمینه یا بعد برای هر دسته در نظر گرفته شد -اندازه، خطر، هوش، سن، و سرعت.

محققان دریافتند که در میان آن بسیاری از اشیا و زمینه‌ها، روش آن‌ها بسیار شبیه به شهود انسانی ثابت شده‌است. (برای انجام این مقایسه، محققان همچنین از گروه‌های ۲۵ نفری خواستند تا ارزیابی‌های مشابهی را در مورد هر یک از گروه‌های ۵۲ کلمه‌ای انجام دهند.)

به‌طور قابل‌توجهی، این سیستم یاد گرفت که درک کند که نام‌های «بتی» و «جورج» از نظر نسبتا قدیمی بودن مشابه هستند، اما آن‌ها جنسیت متفاوتی دارند. و اینکه «وزنه‌برداری» و «شمشیربازی» مشابه هم هستند چون هر دو معمولا در داخل خانه انجام می‌شوند، اما از نظر میزان اطلاعاتی که نیاز دارند متفاوت هستند.

بلانک گفت: «این روشی بسیار ساده و کاملا شهودی است.» مرز بین «بزرگ» و «کوچک» مانند یک مقیاس ذهنی است، و ما حیوانات را در آن مقیاس قرار می‌دهیم.

بلانک گفت که او در واقع انتظار کار کردن این تکنیک را نداشت، اما وقتی این کار را انجام داد خوشحال شد.

او گفت: «به نظر می‌رسد که این سیستم یادگیری ماشینی بسیار باهوش‌تر از آن چیزی است که ما فکر می‌کردیم؛ آن شامل اشکال بسیار پیچیده دانش است و این دانش در یک ساختار بسیار شهودی سازماندهی شده‌است.» «تنها با دنبال کردن اینکه کدام کلمات با یکدیگر در زبان اتفاق می‌افتند، می‌توانید چیزهای زیادی در مورد جهان یاد بگیرید.»

این متن با استفاده از ربات ‌ترجمه مقالات هوش مصنوعی ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.