شرکت OpenAi به جنگ با سیری اپل و الکسای گوگل میرود

نسخه جدید دستیار صوتی ChatGPT که OpenAI در دوشنبه نشان داد که شوخی می‌کند، سرزنش می‌کند، عذرخواهی می‌کند، وانمود می‌کند که سرخ می‌شود - و می‌داند چگونه با وقفه‌ها کنار بیاید. چرا مهم است: ChatGPT-4o سطح جدیدی از تسلط مکالمه بلادرنگ را به نمایش می گذارد - از جمله توانایی درک زمینه و تغییر دنده زمانی که مردم روی آن صحبت می کنند - که دستیاران هوش مصنوعی برای جلب نظر کاربران جهان به آن نیاز دارند.

هدایت اخبار: ChatGPT-4o جدید (که حروف کوچک "o" برای "omni" است) 15 دقیقه زمان پخش زنده را با رهبران OpenAI روی صحنه در مقابل مخاطبان حضوری از کارمندان شرکت سپری کرد.

این ربات با صدای زنانه‌ای صحبت می‌کرد، و نسبت به نسل‌های قبلی ربات‌های صوتی، بسیار سریع‌تر به پرسش‌ها پاسخ می‌داد، با عطف انسان دقیق‌تر و بهتر از احساسات انسانی تقلید می‌کرد.

تصویر بزرگ: پیشرفت های نشان داده شده توسط OpenAI باعث می شود آخرین نسل دستیارها - از جمله سیری اپل، الکسای آمازون و دستیار گوگل - قدیمی به نظر برسند.

همانطور که Axios قبلا گزارش داده بود، گوگل و آمازون هر دو در حال تلاش برای تقویت دستیاران خود با استفاده از هوش مصنوعی مولد هستند.

گفته می‌شود که اپل در حال آماده‌سازی یک ارتقاء برای سیری نیز است، اگرچه گفته می‌شود که در حال مذاکره با گوگل و OpenAI برای استفاده از مدل‌های آن‌ها است.

گوگل قصد دارد در کنفرانس توسعه‌دهندگان I/O خود در اواخر روز سه‌شنبه بر پیشرفت‌های هوش مصنوعی تمرکز کند و گفته است که پیشرفت‌هایی در گفتگو وجود خواهد داشت.

بزرگ‌نمایی: در دموهای OpenAI، این شرکت توانایی آخرین ChatGPT را برای خواندن داستانی که پیش‌نویس آن را با سطوح هیجان‌انگیز دراماتیک و همچنین با صدای ربات مصنوعی، در صورت درخواست، نشان داد.

این یک پیشرفت بزرگ نسبت به روزهای نه چندان دور است، زمانی که صدای رباتیک تنها گزینه برای صدای تولید شده توسط رایانه بود.

در مرحله‌ای از نسخه نمایشی، مارک چن، رئیس تحقیقات مرزی OpenAI، از ChatGPT راهنمایی‌هایی برای آرام کردن اعصابش خواست، و چت ربات نفس‌های عمیق را پیشنهاد کرد. وقتی چن با تهویه بیش از حد پاسخ داد، ChatGPT پاسخ داد: "اوه، کمی سرعت را کم کن مارک - تو جاروبرقی نیستی!"

OpenAI حتی نشان داد که ChatGPT جدید می تواند یک آهنگ را حمل کند. آهنگ‌های آواز آن توانایی‌های من را بسیار تحت الشعاع قرار می‌دهد، هرچند که شاید هنوز در سطح «American Idol» نباشند.

چگونه کار می‌کند: مارک چن، رئیس تحقیقات مرزی OpenAI، گفت که یک پیشرفت کلیدی در بهبود حالت صدای ربات زمانی رخ داد که شرکت کارهایی را که قبلاً توسط چندین مدل جداگانه انجام شده بود، ادغام کرد.

چن به آکسیوس گفت: «ما مدلی را به صورت سرتاسری آموزش دادیم که می توانست گفتار را وارد کند و همچنین گفتار را تولید کند. این به سرعت پاسخ‌ها کمک می‌کند، "و همچنین احساسات در این خط لوله گم نمی‌شوند."

بین خطوط: بسیاری از ناظران در داخل و خارج از OpenAI چت بات را با دستیار هوش مصنوعی اسکارلت جوهانسون در فیلم «Her» در سال 2013 مقایسه کردند.

سرمایه گذار و نویسنده MG Siegler در X پست کرد: "به غیر از فناوری، OpenAI در تولید همه اینها به گونه ای خوب باقی می ماند که مردم را هیجان زده کند و مایل به استفاده از آن باشند." آنها این وظیفه را می دانستند. نسخه سامانتا از "Her" و آنها این کار را انجام دادند."

بله، اما: دیگران به سرعت به این نکته اشاره کردند که «او» پایان خوشی نداشته است.

برایان بارت از وایرد نوشت: «او» فیلم فوق‌العاده‌ای است و من فکر می‌کنم همه در OpenAI باید یک بار دیگر آن را تا آخر ببینند.

فتنه: هنگامی که گروه وسیعی از انسان های بدجنس شروع به درگیر شدن با ChatGPT-4o می کنند، مطمئناً برخی نوسانات وحشی را پرتاب می کنند، همان کاری که ChatGPT اصلی معروف بود.

حتی در محیط کاملاً کنترل‌شده عرضه محصول، زمانی که تیم OpenAI سعی می‌کرد به نسخه‌ی نمایشی خود پایان دهد، ChatGPT با این جمله، "وای، این کاملاً لباسی است که به تن دارید!"

توسعه‌دهندگان OpenAI این قابلیت را نادیده گرفتند، اما می‌توانید شرط‌بندی کنید که بسیاری از کاربران این کار را نکنند.

حباب فکری ما: دوستانه کردن دستیارهای صوتی منطقی است، اما به نظر می‌رسد OpenAI عمداً به سطحی از گرما می‌پردازد که می‌تواند خیلی سریع به هم بریزد - هم برای کاربران و هم برای شرکت.

میرا موراتی، مدیر ارشد فناوری OpenAI اذعان کرد که ChatGPT-4o به آزمایش و بهبود بیشتری نیاز دارد.

موراتی به آکسیوس گفت: «ما تیم‌های قرمز زیادی را انجام داده‌ایم. اما مطمئناً، شما باید دسترسی را گسترش دهید و ببینید مردم با آن چه کارهای عجیب و غریبی انجام می دهند."

بعدی: OpenAI قابلیت‌های متن و تصویر ChatGPT-4o را فوراً در اختیار برخی از مشتریان قرار داد، در حالی که گفت نسخه آلفا از حالت صوتی بهبود یافته در هفته‌های آینده برای مشترکین پولی ChatGPT Plus منتشر خواهد شد.

🔹این مقاله به صورت ماشینی، توسط Aiticle ترجمه شده و ممکنه ایراداتی داشته باشه، فیدبک‌های شما به ما در جهت بهبود سیستممون خیلی کمک میکنه :) لطفا نظراتتون رو باهامون به اشتراک بگذارین.