اپن ای آی یک هوش مصنوعی برای پرسش و پاسخ های طولانی به نام chatGPT معرفی کرد که به سوالات پیچیده به صورت مکالمه پاسخ می دهد. این یک فناوری انقلابی است زیرا آموزش داده شده است تا بفهمد انسان هنگام پرسیدن چه چیزی را می پرسد. بسیاری از کاربران از توانایی آن در ارائه پاسخ های باکیفیت شگفت زده شده اند و این احساس را القا می کند که ممکن است در نهایت این قدرت را داشته باشد که نحوه تعامل انسان ها با رایانه را مختل کند و نحوه بازیابی اطلاعات را تغییر دهد.
چت جی پی تی چیست؟
چت جی پی تی، یک چت بات large language model است که براساس GPT-3.5 توسعه یافته است. توانایی قابل توجهی در تعامل در قالب گفتگوی محاوره ای و ارائه پاسخ هایی دارد که می تواند به طرز شگفت آوری انسانی به نظر برسد.
پلتفرم های large language models وظیفه پیش بینی کلمه بعدی را در یک سری کلمات انجام می دهند. یادگیری تقویتی با بازخورد انسان (RLHF) یک لایه آموزشی اضافی است که از بازخورد انسانی برای کمک به chatGPT برای یادگیری توانایی پیروی از دستورالعمل ها و ایجاد پاسخ های رضایت بخش برای انسان استفاده می کند.
چه کسی chatGPT را ساخت؟
چت جی پی تی توسط شرکت هوش مصنوعی OpenAI مستقر در سانفرانسیسکو ایجاد شده است. OpenGPT به دلیل معرفی DALL.E که یک مدل یادگیری عمیق که تصاویر را از دستورالعمل های متنی به نام prompt تولید می کند معروف است. مدیر شرکت سام آلتمن است که قبلا رئیس Y Combinator بود.
Large language models
چت جی پی تی یک large language model (LLM) است. LLM ها با مقادیر انبوهی از داده ها آموزش داده می شوند تا دقیقا پیش بینی کنند چه کلمه ای در یک جمله قرار می گیرد. مشخص شده است که افزایش مقدار دادهريال توانایی مدل های زبان را برای انجام کارهای بیشتر افزایش می دهد.
LLMها کلمه های بعدی در یک جمله و جملات بعدی را پیش بینی می کنند. ای توانایی به آن ها اجازه می دهد پاراگراف ها و کل صفحه محتوا را بنویسند. اما LLMها از این جهت محدود هستند که همیشه نمی دانند یک انسان دقیقا چه می خواهد و اینجاست که chatGPT با آموزش تقویت کننده با بازخورد انسانی (RLHF) پیشرفت می کند.
چت جی پی تی چگونه آموزش داده شده است؟
جی پی تی 3.5 روی حجم عظیمی از داده ها در مورد کد و اطلاعات از اینترنت، از جمله منابعی مانند بحث های reddit، آموزش داده شده تا به chatGPT در یادگیری گفتگو و دستیابی به سبک پاسخ دهی انسانی کمک کند.
چت جی پی تی همچنین با استفاده از بازخورد انسانی آموزش داده شد تا هوش مصنوعی متوجه شود که انسان ها هنگام پرسیدن سوال چه انتظاراتی دارند. آموزش LLM به این روش انقلابی است زیرا فراتر از آموزش ساده LLM برای پیش بینی کلمه بعدی است.
چیزی که chatGPT را از یک چت بات ساده متمایز می کند این است که به طور خاص برای درک هدف انسان در یک سوال و ارائه پاسخ های مفید، واقعی و بی ضرر آموزش داده شده است. به دلیل نوع آموزش، chatGPT ممکن است سوالات خاصی را به چالش بکشد و بخش هایی از سوال را که منطقی نیستند کنار بگذارد. مقاله تحقیقاتی دیگری مربوط به chatGPT نشان می دهد که چگونه آنها هوش مصنوعی را برای پیش بینی آنچه که انسان ترجیح می دهد آموزش دادند. محققان متوجه شدند که معیارهای مورد استفاده برای رتبه بندی خروجی های پردازش زبان طبیعی هوش مصنوعی منجر به ماشین هایی می شود که امتیاز خوبی در این معیارها کسب می کنند، اما با آنچه انسان ها انتظار داشتند همسو نمی شود. بنابراین راه حلی که آن ها طراحی کردند، ایجاد یک هوش مصنوعی بود که بتواند پاسخ های بهینه سازی شده برای آنچه انسان ها ترجیح می دهند ارائه دهد. برای انجام این کار، آنها هوش مصنوعی را با استفاده از مجموعه داده هایی از مقایسه های انسانی بین پاسخ های مختلف آموزش دادند تا دستگاه در پیش بینی پاسخ های رضایت بخش از نظر اسنان ها بهتر عمل کند.
محدودیت های chatGPT چیست؟
Limitation on toxic response
چت جی پی تی به طور خاص برنامه ریزی شده است تا پاسخ های سمی یا مضر ارائه نکند. بنابراین از پاسخ دادن به این نوع سوالات اجتناب خواهد کرد.کیفیت پاسخ ها به کیفیت دستورالعمل ها بستگی دارد. یک محدودیت مهم chatGPT این است که کیفیت خروجی به کیفیت ورودی بستگی دارد. به عبارت دیگر، دستورالعمل های خبره پاسخ های بهتری را ایجاد می کنند.
پاسخ ها همیشه درست نیستند.
محدودیت دیگر این است که چون آموزش داده شده است تا پاسخ هایی را ارائه دهد که برای انسان درست باشد، پاسخ ها می توانند انسان را فریب دهند.! بسیاری از کاربران دریافتند که chatGPT می تواند پاسخ های نادرستی ارائه دهد، برخی از آنها به شدت نادرست هستند.
OpenAi محدودیت های chatGPT را توضیح می دهد.
چت جی پی تی گاهی اوقات پاسخ های نادرست یا بی معنی ارائه می دهد. رفع این مشکل چالش برانگیز است زیرا:
1- در طول آموزش، در حال حاضر هیچ منبعی از حقیقت وجود ندارد.
2- آموزش محتاط تر مدل باعث می شود تا سوالاتی را که می تواند به درستی پاسخ دهد را رد کند!
3- آموزش تحت نظارت مدل را گمراه می کند، زیرا پاسخ ایده ال به آنچه مدل می داند بستگی دارد تا آنچه human demonstrator می داند.
آیا استفاده از chatGPT رایگان است؟
استفاده از chatGPT در حال حاضر، در زمان "پیش نمایش" رایگان است. چت بات در حال حاضر برای کاربران باز است تا بتوانند پاسخ ها را امتحان کنند و بازخورد ارائه کنند تا هوش مصنوعی بتواند در پاسخ به سوالات بهتر عمل کند و از اشتباهات خود درس بگیرد.
در حال حاضر مسابقه ای با جایزه 500 دلاری در chatGPT وجود دارد تا مردم را تشویق کنند که به پاسخ ها امتیاز دهند.
آیا مدل های زبان جایگزین جستجوی گوگل می شوند؟
خود گوگل قبلا یک ربات چت هوش مصنوعی به نام LaMDA ایجاد کرده است. عملکر چت بات گوگل آنقدر به مکالمه انسانی نزدیک بود که یک مهندس گوگل ادعا کرد که LamDA was sentient.
با توجه به اینکه چگونه این LLMها می توانند به این همه سوال پاسخ دهند، آیا دور از ذهن است که شرکتی مانند OpenAI، گوگل یا مایکروسافت روزی جستجوی سنتی را با یک ربات چت هوش مصنوعی جایگزین کنند؟!
برخی در توییتر قبلا اعلام کرده اند که chatGPT گوگل بعدی خواهد بود.
چگونه می توان از chatGPT استفاده کرد؟
چت جی پی تی می تواند کد، شعر، آهنگ و حتی داستان کوتاه را به سیک یک نویسنده خاص بنویسد. تخصص در دستورالعمل ها، chatGPT را از یک منبع اطلاعاتی به ابزاری ارتقا می دهد که می توان از آن برای انجام یک کار درخواست کرد. این باعث می شود که برای نوشتن یک مقاله در مورد هر موضوعی مفید باشد. chatGPT می تواند برای ایجاد طرح کلی برای مقالات یا حتی کل رمان ها عمل کند.
نتیجه
همان طور که قبلا ذکر شده است، chatGPT به عنوان ابزاری در نظر گرفته شده است که در نهایت عموم برای استفاده از آن باید هزینه بپردازند. بیش از یک میلیون کاربر برای استفاده از chatGPT در پنج روز اول از زمان باز شدن ثبت نام کرده اند.