تیم Qwen علیبابا مدل جدید تولید تصویر خود را با نام Qwen-Image-2.0 معرفی کرد. این مدل که در ۱۰ فوریه ۲۰۲۶ (۲۲ بهمن ۱۴۰۴) منتشر شده، نقطه عطفی در معماری مدلهای تصویرسازی این شرکت محسوب میشود.
برخلاف نسخههای پیشین مانند Qwen-Image-2511 و Qwen-Image-2509 که به دو مدل جداگانه برای تولید (Text-to-Image) و ویرایش (Image Editing) تقسیم شده بودند، Qwen-Image-2.0 هر دو وظیفه را در یک مدل واحد ادغام کرده است. این یکپارچگی به معنی سادهسازی چشمگیر گردش کار است؛ کاربران دیگر نیازی به جابهجایی بین چند مدل برای تولید و سپس ویرایش تصویر ندارند و میتوانند تمام مراحل را در یک بستر و با یک API انجام دهند.
قابلیتهای فنی و عملکرد در رقابتها
Qwen-Image-2.0 با معماری سبکتر اما قدرتمندتر طراحی شده است. این مدل از ورودی متنی تا ۱۰۰۰ توکن پشتیبانی میکند و قادر به تولید تصاویر با رزولوشن بومی ۲K (۲۰۴۸×۲۰۴۸ پیکسل) است. یکی از ویژگیهای برجسته آن، تولید دقیق متون طولانی داخل تصویر است که آن را برای ساخت اینفوگرافیکهای پیچیده، اسلایدهای حرفهای، پوسترهای دو زبانه و کتابهای مصور ایدهآل میسازد.
در ارزیابیهای انسانی پلتفرم AI Arena، این مدل توانسته است عملکرد فوقالعادهای از خود نشان دهد. Qwen-Image-2.0 در بخش تولید تصویر از متن (Text-to-Image) با کسب رتبه اول، پس از دو مدع نانو بانانا پرو و جیپیتی ۱.۵ در جایگاه سوم قرار دارد. نکته قابل توجه، درصد پیروزی ۸۲ درصدی این مدل در رقابتهای رو در رو است که نشاندهنده برتری چشمگیر آن در جلب رضایت کاربران نسبت به رقبا میباشد.
تغییر در سیاست دسترسی
برخلاف نسخههای گذشته مانند Qwen-Image-2511 که تحت لایسنس آزاد Apache 2.0 منتشر شده و برای استفاده تجاری و شخصی رایگان بودند، Qwen-Image-2.0 فعلاً دسترسی آزاد ندارد.