مدل Qwen-Image-2512 بهعنوان بهروزرسانی جدید مدل متنبهتصویر Qwen منتشر شد؛ مدلی که با تمرکز بر واقعگرایی چهرهها، جزئیات طبیعی و رندر دقیق متن، وارد رقابت مستقیم با گزینههای مشهوری مثل نانو بنانا و ChatGPT Images شده است.
جدیدترین اخبار تکنولوژی هوش مصنوعی و شبکههای اجتماعی را در نامبرلند بخوانید.
براساس گزارش منتشرشده از تیم توسعهدهنده Qwen، مهمترین تغییر نسخه 2512، کاهش محسوس حس «ساختهشده با هوش مصنوعی» است؛ بهویژه در چهره انسانها که حالا طبیعیتر، زندهتر و هماهنگتر با نور و محیط دیده میشوند.
این مدل هماکنون از طریق Qwen Chat، Hugging Face و ModelScope در دسترس است.
ویژگیهای مدل Qwen-Image-2512
بهطور خلاصه، مهمترین قابلیتهایی که Qwen-Image-2512 را از نسخههای قبلی و بسیاری از رقبا متمایز میکند، شامل موارد زیر است:
- واقعگرایی بالاتر چهره انسان: نمایش طبیعیتر پوست، حالات صورت، سن و نورپردازی.
- جزئیات طبیعی دقیقتر: بهبود چشمگیر در رندر مناظر، حیوانات، بافتها و عناصر محیطی.
- درک بهتر پرامپت: اجرای دقیقتر توصیفهای متنی، ژستها، تعامل سوژهها و فضای صحنه.
- رندر متن با کیفیت بالاتر: نمایش خواناتر نوشتهها و ترکیب بهتر متن و تصویر در صحنههای شلوغ.
- عملکرد رقابتی در مقیاس بزرگ: نتایج برتر در تستهای گسترده و ارزیابیهای کور.
مقایسه Qwen-Image-2512 با نانو بنانا و ChatGPT Images
برای مقایسه عملی، هر سه مدل تصویرساز جمینای، چت جیپیتی و Qwen با یک پرامپت یکسان تصویرسازی کردهاند.
Qwen-Image-2512
بافت خز گرینچ طبیعی و لایهلایه دیده میشود و ریش بابانوئل جزئیات قابلقبولی دارد. نورپردازی صحنه متعادل است و آتشبازیها با عمق و رنگبندی طبیعی در پسزمینه قرار گرفتهاند؛ اما تصویر افراد واضح نیست. نوشته «HAPPY NEW YEAR 2026» خوانا، درست و بدون خطای رندر است.

Nano Banana
نانو بنانا تصویری پررنگ، سینمایی و چشمنواز تولید کرده است. رنگها اشباعتر هستند و نورپردازی حالوهوای فیلمی دارد. برخی جزئیات ریز، مانند بافت خز و لباسها، حالت بیشازحد نرم پیدا کردهاند. شلوغی جمعیت و فضای جشن بهخوبی منتقل میشود.

ChatGPT Images
خروجی ChatGPT Images تمیز و متعادل است، اما سادهتر به نظر میرسد. جزئیات خز گرینچ و ریش بابانوئل نسبت به دو مدل دیگر کمتر است. نورپردازی و ترکیببندی کلی قابل قبول است، اما عمق صحنه و حس شلوغی جشن سال نو ضعیفتر منتقل میشود. متن «HAPPY NEW YEAR 2026» خوانا است، اما کمتر در فضای تصویر ادغام شده است.

برخلاف نانو بنانا و مدل تصویرساز چت جیپیتی، مدل qwen image امکان انتخاب ابعاد را دارد. همین قابلیت انتخاب نسبت تصویر در grok imagine هم، به تازگی اضافه شده است.
