بررسی اولین همایش شرکت OpenAI
دوشنبه شب گذشته به وقت ایران، همایش روز توسعه (devday) که اولین همایش شرکت OpenAI بود، برگزار شد. در این رویداد تکنولوژیهای جدید و اخبار جالبتوجهی که OpenAI برای بازار هوش مصنوعی داشت ارائه شد. در ادامه به بخشهای مهم روز توسعه میپردازیم.
نسل جدید GPT-4، با اسم GPT-4 Turbo
سم آلتمن، یکی از اعضای هیاتمدیرۀ شرکت بیان کرد:«GPT-4 Turbo توانایی بیشتری دارد و از رویدادهای جهانی تا آوریل ۲۰۲۳ آگاهی دارد. ۱۲۸ هزار توکن را پاسخگو خواهد بود و این به زبان سادهتر یعنی می تواند معادل بیش از ۳۰۰ صفحه متن را در یک ورودی جا دهد. ما همچنین عملکرد آن را بهینه کردیم تا بتوانیم GPT-4 Turbo را با قیمت ۳ برابر ارزانتر برای توکنهای ورودی و ۲ برابر ارزانتر برای توکنهای خروجی در مقایسه با GPT-4 ارائه کنیم.» منظور آلتمن از توکن واحدهای جداگانه از متن هست؛ بطور مثال هر کلمه، نقطه ویرگول یا فضای خالی به عنوان یک توکن شمرده میشود.
در ادامۀ این توضیحات، به صورت تخصصیتر به ویژگیهای این نسل مانند فراخوانی تابع موازی، خروجی تکرارپذیر و حالت JSON پرداخت که بیان آنها در این متن نمیگنجد. اگر به دانستن این ویژگیها علاقهمندید، سری به بخش بلاگ در سایت OpenAI بزنید.
در این میان، نسل جدید GPT-3.5 هم رونمایی شد. GPT-3.5 Turbo توانایی پاسخدهی به ۱۶ هزار توکن را دارد و ویژگیهای نسخۀ ۴ این نسل را که قبلتر بیان شد، به خود اضافه کرده است مانند فراخوانی تابع موازی. این توسعه باعث بهبود ۳۸ درصدی عملکرد آن در تولید فرمتهایی مثل JSON میشود.
دستیار بدون مرز
آلتمن اضافه کرد:« امروزاولین قدم ما برای کمک به توسعهدهندگان برای ایجاد تجربههای دستیاری در برنامههای خود یعنی APIدستیار را منتشر میکنیم. این دستیار یک هوش مصنوعی هدفمند است که دستورالعملهای خاصی دارد، از دانش اضافی بهره میبرد و میتواند مدلها و ابزارها را برای انجام کارها فراخوانی کند؛ قابلیتهای جدیدی مانند مفسر کد و بازیابی و همچنین فراخوانی تابع برای انجام بسیاری از کارهای سنگینی که قبلاً باید خودتان انجام میدادید، ارائه میشود و شما را قادر میسازد تا برنامههای هوش مصنوعی با کیفیت بالا بسازید.
این API برای انعطافپذیری طراحی شده است؛ موارد استفاده از آن را میتوان به صورت یک برنامۀ تجزیه و تحلیل داده مبتنی بر زبان طبیعی، یک دستیار کدنویسی، یک برنامهریز تعطیلات مبتنی بر هوش مصنوعی یا یک بوم تصویری هوشمند و خیلی موارد دیگر دانست. API دستیار بر اساس همان قابلیتهایی ساخته شده است که محصول جدید GPT ما را فعال می کند؛ دستورالعملها و ابزارهای سفارشی مانند مفسر کد، بازیابی، و فراخوانی تابع.
یک تغییر کلیدی که توسط این APIمعرفی شده است، threadهای مداوم و بینهایت طولانی است که به توسعهدهندگان اجازه میدهد تا مدیریت وضعیت threadرا به OpenAI بسپارند و روی محدودیتهای توکنها کار کنند. با APIشما به سادگی هر پیام جدید را به یک thread موجود اضافه می کنید.»
*یک توضیح کوتاه در مورد API و thread:
API یا Application Programming Interface: بهطور کلی به مجموعهای از توابع و رویهها که به برنامههای کاربردی دیگر اجازه دسترسی و استفاده از ویژگیها یا دادههای یک نرمافزار را میدهد، APIهای آن نرمافزار گفته میشود.
thread : یک فرایند کوچک داخل یک برنامه است که بهصورت همزمان با سایر threadها اجرا میشود و قابلیت اجرای همزمان چند کار را به برنامه میدهد.
مدلسازی با شما!
برخی از شرکتها و سازمانها دادههای بسیار زیادی دارند، بهطوریکه حدود میلیاردها توکن برای کارهای حداقلی خود نیاز دارند. پس مدلهای GPT باید برای آنها شخصیسازی شود. این امکان بسیار محدود و پرهزینه در دسترس قرار گرفته تا شرکتها بهراحتی از آن استفاده کنند. همچنین این شخصیسازی به معنای دادن اطلاعات زیادی از شرکتها است که ریسک زیادی برای آنهاست. بااینحال OpenAI در برابر امنیت و حفظ حریم شخصی دادههای آنها اطمینان داده و آن را تضمین کرده است.
سقف نرخ توکن
برای کمک به مشتریان در مقیاسبندی برنامههایشان، محدودیت توکنها در دقیقه برای همه کاربران GPT-4 دو برابر شده است. همچنین میتوانند محدودیتهای نرخ جدید خود را در صفحه مشاهده کنند. بهعلاوۀ آن، شرکت OpenAI لایههای استفادۀ خود را منتشر کرده که تعیینکنندۀ افزایش محدودیتهای نرخ خودکار است؛ بنابراین کاربران میدانند که چگونه به طور خودکار محدودیتهای استفادۀ آنها مقیاس میشوند. از طرف دیگر، اکنون میتوانیم از تنظیمات حساب خود، درخواست افزایش محدودیتها را ثبت کنیم.
سپر کپیرایت
آلتمن در اواخر صحبتهای خود به حق نسخهبرداری یا کپیرایت پرداخت: «OpenAI متعهد به محافظت از مشتریان خود با حفاظت از حق کپیرایت داخلی در سیستمهای شرکت است. امروز، ما یکقدم جلوتر میرویم و سپر حق کپیرایت را معرفی میکنیم. اکنون وارد عمل میشویم و از مشتریان خود دفاع میکنیم و اگر با ادعاهای قانونی در مورد نقض حق نسخهبرداری مواجه شوید، هزینههای متحمل شده را میپردازیم.»