شما اخراجید
حتی اگر در چند ماه اخیر، زیر سنگ زندگی کرده باشید، باز هم احتمالا با ChatGPT، معجزه این روزهای دنیای تکنولوژی و به خصوص هوش مصنوعی آشنا هستید. مدل زبان گسترده (LLM) معروفی که با تولید محتوای متنی بسیار نزدیک به زبان طبیعی، باعث ایجاد موج جدیدی از هیجان در جهان شده و برخی آن را گامی بزرگ در جهت نزدیک تر شدن به رویای همیشگی هوش مصنوعی عمومی (General-Purpose AI) می دانند.
اما همه واکنش ها نیز مثبت نبوده و از روزهای اول انتشار آزمایشی این مدل توسط OpenAI، برخی نسبت به تاثیرات اجتماعی و اقتصادی و سیاسی این تکنولوژی هشدار داده اند. بحث های زیادی حول محور تحولات بازار کار و اقتصاد و سیاست در پرتو این تکنولوژی نوظهور وجود داشته و دارد اما این بار، در مقاله ای تحت عنوان GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models بنیاد OpenAI , OpenResearch و دانشگاه پنسیلوانیا، به بررسی این موضوع پرداخته اند.
هدف ما در اینجا، توضیح بخش به بخش و دقیق این مقاله نیست بلکه بیشتر به تصویر کلی ای که این مقاله سعی در پرداختن به آن دارد، توجه میکنیم.
مدل های زبانی گسترده
مدل های زبانی گسترده، معمولا به مدل های بر پایه GPT منتسب می شوند. واضحا یکی از دلایل این موضوع را میتوان موفقیت گسترده ChatGPT دانست که بیش از گذشته، بحث در مورد مدل های زبانی گسترده را بر سر زبان ها انداخت، اما این همه ماجرا نیست. تاریخ ظهور مدل های زبانی گسترده، به سال 2018 برمی گردد. از ویژگی بارز این مدل ها میتوان به توانایی آنها در پردازش داده های ترتیبی مثل زبان طبیعی، زبان های برنامه نویسی و بازی های شطرنج اشاره کرد.
شاید این طور به نظر بیاید که مدل های برپایه GPT، اولین مدل هایی باشند که از پتانسیل مدل های زبانی گسترده استفاده کرده اند و ChatGPT، اولین چت باتی باشد که این تکنولوژی را به طور گسترده به کاربران عرضه کرده باشد، درصورتی که در سال 2021، حدود یک سال قبل از انتشار نسخه آزمایشی ChatGPT، گیت هاب برای اولین بار از انتشار دستیار توسعه دهنده نرم افزار خود به نام Copilot خبر داد که البته به طور اشتراکی توسط گیت هاب و OpenAI توسعه داده شده و یک مدل زبانی گسترده به شمار می رود.
اما آیا صرف داشتن یک مدل خوب Train شده کافی است؟
در مقدمه مقاله ای که بالاتر به آن اشاره شد، گفته می شود که هدف این مطالعه، کمتر به بررسی روند پیشرفت خود این مدل ها به تنهایی بوده و بیشتر، تاثیر تکنولوژی های مکملی که بر پایه این مدل ها توسعه یافته اند، مورد بررسی قرار گرفته است. اهمیت این نکته در مقدمه، این است که یک مدل زبانی گسترده، درکنار ابزارهایی که به طور بهینه تر و موثرتری از توانایی های این مدل استفاده میکنند، مشخص می شود. درست است که امکان دسترسی مستقیم ما به این مدل ها وجود دارد ولی نکته مهم تر، نحوه برخورد و تعامل با این مدل هاست. پاسخی که مدل به یک Prompt یا درخواستی که به طور هوشمندانه نوشته شده می دهد، به مراتب ارزشمند تر از این است که درخواستی آماتور گونه بنویسیم و به طبع جوابی غیر دقیق دریافت کنیم.
همچنین ممکن است علی رغم دریافت جوابی دقیق، نتوانیم با حجم انبوه اطلاعاتی که مدل به ما میدهد، کار ارزشمندی انجام دهیم. در این موارد است که وجود یک تکنولوژی مکمل که بتواند هم به بهترین نحو از مدل اطلاعات استخراج کرده و هم بتواند از اطلاعات دریافتی به بهترین نحو استفاده کند، اهمیت زیادی پیدا میکند.
نحوه اثرگذاری روی مشاغل
برای اندازه گیری میزان تاثیرگذاری مدل های زبان گسترده روی مشاغل، از معیاری به نام exposure یا در معرض بودن استفاده می شود. در معرض بودن به صورت "تاثیرات اقتصادی بدون فرق گذاشتن بین اثرات مشارکت همزمان انسان و ماشین یا جایگزین کردن انسان با ماشین" تعریف شده است. پیش بینی نویسندگان مقاله این است که حداقل نیمی از وظایف 19% مشاغل، با درنظر گرفتن توانایی های فعلی و ابزارهای مکملی که در آینده بر اساس آنها تولید خواهند شد، در معرض LLM هستند اما ارزیابی های انسانی نشان میدهد که بیش از نیمی از وظایف تنها 3 درصد از کارگران آمریکایی (کارگر به معنی فرد شاغل) درمعرض مدل های GPT، آن هم بدون درنظر گرفتن ابزارهای اضافی، هستند.
اما آیا مشاغلی هست که حتی با وجود خطر درمعرض قرار گرفتن، بدون ترس از شنیدن جمله "شما اخراجید!"، به کار خود ادامه دهند؟
تحلیل های نویسندگان مقاله نشان می دهد که مشاغلی که بسیار وابسته به مهارت های علمی و تفکر انتقادی هستند، همبستگی منفی با درمعرض قرار گرفتن نشان میدهند، درصورتی که مشاغلی که وابسته به مهارت های برنامه نویسی یا نویسندگی هستند، دارای همبستگی مثبت اند. یک دلیل احتمالی برای توضیح این مسئله، میتواند این باشد که مدل های فعلی، با وجود توانایی فوق العاده تولید زبان طبیعی، هنوز نیازمند تحقیق و توسعه بیشتر در بخش توانایی حل مسئله و تفکر انتقادی هستند. امکان دارد در آینده با توسعه این توانایی ها، این بخش از مشاغل نیز درمعرض قرار بگیرند ولی با توجه به اطلاعات و توانایی های حال حاضر این مدل ها، این مشاغل در امان اند.
برای تایید این موضوع، میتوان به این جمله در بخش GPT-4 وبسایت OpenAI اشاره کرد :
GPT-4 can solve difficult problems with greater accuracy, thanks to its broader general knowledge and problem solving abilities.
یکی از مولفه های مهمی که در توسعه GPT-4 به آن توجه شده، توسعه توانایی های حل مسئله و خلاقیت مدل در ارائه پاسخ هاست، که نشانگر این است که این در بخش، هنوز کارهای زیادی برای انجام شدن وجود دارد.
مدل هایی همه کاره
از همان روزهای اول، هدف اعلای محققان و توسعه دهندگان هوش مصنوعی، تولید هوش مصنوعی عمومی بود. به این معنا که یک عامل هوشمند، بتواند هر عمل هوشمندی که انسان یا سایر حیوانات انجام میدهند را یاد گرفته یا درک کند. تقابل میان هوش مصنوعی قوی یا ضعیف، عمومی یا محدود، بیانگر تفاوت میان الگوریتم هایی است که به منظور تحقق هوش مصنوعی عمومی توسعه یافته اند و الگوریتم هایی که به طور خاص و محدود، برای یادگیری یک وظیفه خاص طراحی شده اند.
به نظر میرسد که با توجه به پیشرفت بسیار سریع مدل های GPT و به طور کل، مدل های زبانی گسترده، درحال نزدیک شدن به همان آرمان همیشگی محققان هستیم. مدل GPT-4 که درحال حاضر، روی سرویس ChatGPT Plus عرضه شده و هنوز برای کاربرانی که دسترسی عادی به OpenAI دارند، قابل دسترسی نیست، توانایی تحلیل محتوای بصری را نیز داراست و کاربر میتواند هم با Prompt های متنی و هم از طریق تصاویر با مدل تعامل داشته باشد.
امکان دارد در آینده ای نه چندان دور، امکان تعامل صوتی نیز با مدل نیز فراهم شود و این مسئله به طبع، کاربرد تکنولوژی های مکملی که بر پایه مدل های آینده GPT ساخته می شود را نیز گسترده تر میکند. به نظر میرسد که پس از مدت ها کار کردن روی هوش مصنوعی محدود که تلاش داشت هر مسئله را جداگانه حل کند، اکنون به نقطه اجماعی رسیده ایم که میتواند همه تلاش های پیشین را در یک قالب واحد جمع کرده و آنها را با هم هماهنگ کند.
مطلبی دیگر از این انتشارات
نویز را دست کم نگیرید
مطلبی دیگر از این انتشارات
و اینک Ray Tracing
مطلبی دیگر از این انتشارات
تکامل نظریات