مدل Qwen-Image-2512 به‌عنوان به‌روزرسانی جدید مدل متن‌به‌تصویر Qwen منتشر شد؛ مدلی که با تمرکز بر واقع‌گرایی چهره‌ها، جزئیات طبیعی و رندر دقیق متن، وارد رقابت مستقیم با گزینه‌های مشهوری مثل نانو بنانا و ChatGPT Images شده است.

Soundcloud

جدیدترین اخبار تکنولوژی هوش مصنوعی و شبکه‌های اجتماعی را در نامبرلند بخوانید.

براساس گزارش منتشرشده از تیم توسعه‌دهنده Qwen، مهم‌ترین تغییر نسخه 2512، کاهش محسوس حس «ساخته‌شده با هوش مصنوعی» است؛ به‌ویژه در چهره انسان‌ها که حالا طبیعی‌تر، زنده‌تر و هماهنگ‌تر با نور و محیط دیده می‌شوند.

این مدل هم‌اکنون از طریق  Qwen Chat،  Hugging Face و ModelScope در دسترس است.

ویژگی‌های مدل Qwen-Image-2512

به‌طور خلاصه، مهم‌ترین قابلیت‌هایی که Qwen-Image-2512 را از نسخه‌های قبلی و بسیاری از رقبا متمایز می‌کند، شامل موارد زیر است:

  • واقع‌گرایی بالاتر چهره انسان: نمایش طبیعی‌تر پوست، حالات صورت، سن و نورپردازی.
  • جزئیات طبیعی دقیق‌تر: بهبود چشمگیر در رندر مناظر، حیوانات، بافت‌ها و عناصر محیطی.
  • درک بهتر پرامپت: اجرای دقیق‌تر توصیف‌های متنی، ژست‌ها، تعامل سوژه‌ها و فضای صحنه.
  • رندر متن با کیفیت بالاتر: نمایش خواناتر نوشته‌ها و ترکیب بهتر متن و تصویر در صحنه‌های شلوغ.
  • عملکرد رقابتی در مقیاس بزرگ: نتایج برتر در تست‌های گسترده و ارزیابی‌های کور.

مقایسه Qwen-Image-2512 با نانو بنانا و ChatGPT Images

برای مقایسه عملی، هر سه مدل تصویرساز جمینای، چت جی‌پی‌تی و Qwen با یک پرامپت یکسان تصویرسازی کرده‌اند.

Qwen-Image-2512

بافت خز گرینچ طبیعی و لایه‌لایه دیده می‌شود و ریش بابانوئل جزئیات قابل‌قبولی دارد. نورپردازی صحنه متعادل است و آتش‌بازی‌ها با عمق و رنگ‌بندی طبیعی در پس‌زمینه قرار گرفته‌اند؛ اما تصویر افراد واضح نیست. نوشته «HAPPY NEW YEAR 2026» خوانا، درست و بدون خطای رندر است.

Nano Banana

نانو بنانا تصویری پررنگ، سینمایی و چشم‌نواز تولید کرده است. رنگ‌ها اشباع‌تر هستند و نورپردازی حال‌وهوای فیلمی دارد. برخی جزئیات ریز، مانند بافت خز و لباس‌ها، حالت بیش‌ازحد نرم پیدا کرده‌اند. شلوغی جمعیت و فضای جشن به‌خوبی منتقل می‌شود.

ChatGPT Images

خروجی ChatGPT Images تمیز و متعادل است، اما ساده‌تر به نظر می‌رسد. جزئیات خز گرینچ و ریش بابانوئل نسبت به دو مدل دیگر کمتر است. نورپردازی و ترکیب‌بندی کلی قابل قبول است، اما عمق صحنه و حس شلوغی جشن سال نو ضعیف‌تر منتقل می‌شود. متن «HAPPY NEW YEAR 2026» خوانا است، اما کمتر در فضای تصویر ادغام شده است.

برخلاف نانو بنانا و مدل تصویرساز چت‌ جی‌پی‌تی، مدل qwen image امکان انتخاب ابعاد را دارد. همین قابلیت انتخاب نسبت تصویر در grok imagine هم، به تازگی اضافه شده است.