خواندن ۱ دقیقه·۳ ماه پیش

مدل ایجاد و اصلاح تصویر Qwen-Image-2.0

تیم Qwen علی‌بابا مدل جدید تولید تصویر خود را با نام Qwen-Image-2.0 معرفی کرد. این مدل که در ۱۰ فوریه ۲۰۲۶ (۲۲ بهمن ۱۴۰۴) منتشر شده، نقطه عطفی در معماری مدل‌های تصویرسازی این شرکت محسوب می‌شود.

برخلاف نسخه‌های پیشین مانند Qwen-Image-2511 و Qwen-Image-2509 که به دو مدل جداگانه برای تولید (Text-to-Image) و ویرایش (Image Editing) تقسیم شده بودند، Qwen-Image-2.0 هر دو وظیفه را در یک مدل واحد ادغام کرده است. این یکپارچگی به معنی ساده‌سازی چشمگیر گردش کار است؛ کاربران دیگر نیازی به جابه‌جایی بین چند مدل برای تولید و سپس ویرایش تصویر ندارند و می‌توانند تمام مراحل را در یک بستر و با یک API انجام دهند.

قابلیت‌های فنی و عملکرد در رقابت‌ها

Qwen-Image-2.0 با معماری سبک‌تر اما قدرتمندتر طراحی شده است. این مدل از ورودی متنی تا ۱۰۰۰ توکن پشتیبانی می‌کند و قادر به تولید تصاویر با رزولوشن بومی ۲K (۲۰۴۸×۲۰۴۸ پیکسل) است. یکی از ویژگی‌های برجسته آن، تولید دقیق متون طولانی داخل تصویر است که آن را برای ساخت اینفوگرافیک‌های پیچیده، اسلایدهای حرفه‌ای، پوسترهای دو زبانه و کتاب‌های مصور ایده‌آل می‌سازد.

در ارزیابی‌های انسانی پلتفرم AI Arena، این مدل توانسته است عملکرد فوق‌العاده‌ای از خود نشان دهد. Qwen-Image-2.0 در بخش تولید تصویر از متن (Text-to-Image) با کسب رتبه اول، پس از دو مدع نانو بانانا پرو و جی‌پی‌تی ۱.۵ در جایگاه سوم قرار دارد. نکته قابل توجه، درصد پیروزی ۸۲ درصدی این مدل در رقابت‌های رو در رو است که نشان‌دهنده برتری چشمگیر آن در جلب رضایت کاربران نسبت به رقبا می‌باشد.

تغییر در سیاست دسترسی

برخلاف نسخه‌های گذشته مانند Qwen-Image-2511 که تحت لایسنس آزاد Apache 2.0 منتشر شده و برای استفاده تجاری و شخصی رایگان بودند، Qwen-Image-2.0 فعلاً دسترسی آزاد ندارد.

هوش مصنوعی

علی کرامت

شاید از این پست‌ها خوشتان بیاید

علی کرامت

خواندن ۱ دقیقه·۳ ماه پیش

مدل ایجاد و اصلاح تصویر Qwen-Image-2.0

قابلیت‌های فنی و عملکرد در رقابت‌ها

تغییر در سیاست دسترسی

هوش مصنوعی

علی کرامت

شاید از این پست‌ها خوشتان بیاید