ویرگول
ورودثبت نام
cafearz.com
cafearz.com
خواندن ۵ دقیقه·۶ ماه پیش

معرفی هوش مصنوعی سورا (Sora) ویدیویی چت جی‌پی‌تی

هوش مصنوعی سورا: شرکت اوپن ای‌آی (OpenAI) که نقش اساسی در پیشرفت هوش مصنوعی و سازنده چت جی‌پی‌تی ایفا کرده است، به تازگی از هوش مصنوعی تبدیل متن به ویدیوی خود به نام هوش مصنوعی سورا رونمایی کرده است. به گفته کارشناسان هوش مصنوعی Sora قوی‌ترین ابزار مولد تبدیل متن به ویدیو است که بیشتر برای تولید بازی‌های ویدیویی مورد استفاده قرار می‌گیرد. خروجی‌های این هوش مصنوعی انقدر طبیعی و پیشرفته است که OpenAI فعلا تصمیم گرفته که اجازه دسترسی عمومی به آن را صادر نکند. اگر دوست دارین بیشتر با این هوش مصنوعی آشنا شوید، این مقاله که برای شما آماده کرده‌ایم را تا انتها مطالعه کنید. همچنین، شما می‌توانید برای خرید اکانت هوش مصنوعی از حدمات ارزی کافه ارز استفاده کنید.

معرفی هوش مصنوعی سورا؛ انقلابی در زمینه تبدیل متن به ویدیو

هوش مصنوعی سورا احتمالاً یکی از قوی‌ترین هوش مصنوعی‌های مولد (Generative) ارائه‌شده تا به امروز به شمار می‌رود که توسط کمپانی OpenAI وارد بازار شده است. این مدل جدید از محصولات اوپن ای‌آی قابلیت تولید ویدیوهای یک‌ دقیقه‌ای از متن را در اختیار کاربران می‌گذارد. طبقی مقاله‌ای که در وبلاگ OpenAI منتشرشده است، هوش مصنوعی سورا توانایی ساخت صحنه‌هایی پیچیده در کنار شخصیت‌های متعدد را دارد. علاوه بر این، سورا قادر است تا حرکات خاص و جزییات سوژه و پس‌زمینه را به بهترین شکل ممکن نشان دهد. سازندگان این هوش مصنوعی ادعا می‌کنند که سورا قادر است تا شخصیت‌های جذاب با احساست بسیار غنی را نیز تولید نماید.

هوش مصنوعی Sora همچنین می‌تواند از یک تصویر استاتیک، ویدیوهای جذابی تولید کند. یا این که فریم‌های از دست‌رفته در یک ویدیو را تکمیل کرده و آن را به شکلی جذاب گسترش دهد. دسترسی به سورا فعلاً برای همگان آزاد نیست اما ویدیوهایی که به شکل دمو از طریق آن تولید شده است بسیار طبیعی است. برای مثال، یکی از معروف‌ترین ویدیوهایی که با این هوش مصنوعی تولید شده است، صحنه طوفان در کالیفرنیا را نشان می‌دهد که از کیفیت بسیار بالا و قابل قبولی دارد. اوپن ای‌آی همچنین تاکید می‌کند که سورا در حال حاضر در خلق صحنه‌های پیچیده مشکل دارد اما ویدیوهای دمویی که از این ابزار منتشر شده است نشان از قدرت بسیار بالای سورا دارد.

در سال‌های قبل ابزارهای هوش مصنوعی نظیر میدجرنی (Midjourney) در زمینه تبدیل متن به تصویر بسیار پرقدرت ظاهر شدند. اما اخیراً خلق ویدیو از طریق دستورات متنی (Prompt) با سرعت قابل‌توجهی توسط شرکت‌های پیشرو نظیر Pika و Runway آغاز شد. ابزارهایی که توسط این شرکت‌ها وارد بازار شدند، قابلیت‌های بسیار جدیدی در اختیار کاربران قرار دادند اما نقطه عطف این تکنولوژی هوش مصنوعی سورا است. یکی دیگر از ابزارهای جدید به نام هوش مصنوعی Lumiere که توسط گوگل توسعه داده شده است نیز به عنوان یکی از رقبای سرسخت‌ هوش مصنوعی سورا است.

چه کسانی می‌توانند از هوش مصنوعی سورا استفاده کنند؟

در حال حاضر، اوپن ای‌ای دسترسی به سورا را فقط در اختیار تیم‌های قرمز قرار داده است. این تیم‌ امنیتی وظیفه دارد این ابزار را از نظر آسیب‌ها و خطرات احتمالی که ممکن است برای کاربران ایجاد کنند، مورد بررسی دقیق قرار می‌دهند. علاوه بر این، شرکت OpenAI یا هوش مصنوعی chatgpt مجوز استفاده از Sora را به برخی از طراحان و فیلم‌سازان نیز داده است. در حال حاضر، اوپن ای‌آی اذعان می‌کند که هوش مصنوعی سورا ممکن است در خلق صحنه‌های پیچیده دچار مشکل شود چون رابطه علت و معلولی برخی از دستورات را درک نمی‌کند.

جیم فان که از محققان شرکت Nvidia است در جدیدترین بررسی خود اذعان کرده که که سورا فقط یک هوش مصنوعی مولد نیست بلکه یک موتور فیزیکی داده‌محور است. در حقیقت، قابلیت‌های این ابزار فقط به تولید ویدیو از متن یا عکس محدود نمی‌شود بلکه قابلیت تعیین فیزیک هر جسم و شی در یک محیط را دارد و بر اساس دستورات کاربر، یک ویدئو (یا حتی یک جهان سه‌بعدی تعاملی) را خلق می‌کند.

محققان OpenAI نیز اظهار داشته‌اند که سورا ثابت کرده که مقیاس‌پذیری مستمر مدل‌های ویدیویی، این تکنولوژی را به سمت توسعه مورتوهای شبیه‌سازی پیشرفته سوق می‌دهد. در واقع، با این سرعت پیشرفت می‌توان دنیاهای فیزیکی و دیجیتالی را طوری شبیه‌سازی کرد که اشیا و حیوانات و حتی کاربران قادر به زندگی در آن‌ها باشند.

ویژگی‌های هوش مصنوعی Sora

  • تولید ویدیوهایی با کیفیت 1080 با جزییات کامل
  • امکان ساخت ویدیوهای لوپ و جلوبردن و عقب‌کشیدن زمان ویدیو
  • تغییر بک‌گراند ویدیوهای آپلودی توسط کاربر
  • قابلیت ایجاد جهان‌های دیجیتالی (برای مثال می‌توان صحنه‌ای از بازی ماینکرفت را خلق کرد و همزمان کنترل شخصیت بازیکن را به دست گرفت)
  • قابلیت ساخت ویدیواز روی یک تصویر استاتیک

محدودیت‌های هوش مصنوعی سورا

در حال حاضر، هوش مصنوعی سورا در زمینه ساخت بازی‌ها و جلوه‌های ویژه ویدیویی ضعیف عمل می‌کند. برای مثال، این ابزار قادر به تخمین دقیق از تعاملات فیزیکی ساده مانند خردشدن چوب یا شیشه نیست. این ابزار حتی ممکن است در پردازش برخی از رندرهای پیچیده علت و معلولی دچار مشکل شود. برای مثال، ممکن است پرامپت فردی که در حال خوردن برگر است را به راحتی به ویدیو تبدیل کند اما نمی‌تواند محل گاز‌زدن روی برگر را رندر بگیرد.

به طور کلی، اما هوش مصنوعی سورا می‌تواند راه شبیه‌سازی ویدیوهای واقع‌گرایانه را هموار کند و پرامپت‌‌های متنی را به بهترین شکل به کاربران تحویل دهد. این موضوع همان قسمت تاریک و خطرناک هوش مصنوعی است چون همانند فناوری دیپ فیک (Deep Fake) می‌تواند انسان‌ها را گمراه کند. به نظر می‌رسد که OpenAI به همین دلیل دسترسی به آن را محدود نگه داشته است. همنجین، شما می‌توانید در مقاله مقایسه chatgpt 3 با chatgpt4 اطلاعات بیشتری درباره دیگر محصولات این شرکت کسب کنید.

نتیجه‌گیری

ابزارهای هوش مصنوعی با سرعت سرسام‌آوری در حال پیشرفت هستند و روزی نمی‌شود که خبر از یک ابزار هوش مصنوعی جدید در اینترنت نشنویم. یکی از جدیدترین محصولات توسعه‌یافته در این زمینه که اتفاقاً متعلق به شرکت OpenAI است، سورا (Sora) نام دارد که در زمینه تبدیل متن به ویدیو بسیار قدرتمند ظاهر شده است. دسترسی به هوش مصنوعی فعلاً محدود به تیم اجرایی این شرکت است و به نظر می‌رسد که در روزهای اخیر به صورت عمومی معرفی شود. هنوز مشخص نیست که استفاده از این هوش مصنوعی رایگان است یا خیر اما به احتمال خیلی زیاد برای استفاده کامل از امکانات آن باید اشتراک اکانت OpenAI را خریداری کنید. شما برای خرید اکانت این شرکت می‌تواند از سرویس خرید اکانت هوش مصنوعی کافه ارز استفاده کنید.

هوش مصنوعیمصنوعی سوراهوش
کافه ارز یک پلتفرم آنلاین است که در زمینه پرداخت‌های ارزی فعالیت دارد. درکافه ارز میتوانید پرداخت‌های بین‌المللی نظیر پی‌پال، پرفکت‌مانی، وایز و ارزهای‌دیجیتال را با خیال راحت انجام دهید.
شاید از این پست‌ها خوشتان بیاید