تیم تحقیقاتی Qwen از شرکت علی‌بابا پس از اینکه در تابستان امسال پی‌درپی، مدل‌های متن‌باز و قدرتمند زبان و کدنویسی عرضه کردند، اکنون یک مدل هوش مصنوعی تصویرساز جدید معرفی کرده‌اند: Qwen-Image.

هوش مصنوعی Qwen-Image چیست؟

طبق گزارش‌ها، هوش مصنوعی Qwen-Image مدل تصویرسازی است که مزیت آن نقطه‌ضعف مدل‌های دیگر است؛ این مدل می‌تواند نوشته‌ها را به‌طور دقیق در تصویر نمایش دهد.

این هوش مصنوعی نه‌تنها زبان‌های الفبایی مثل انگلیسی را به‌خوبی نمایش می‌دهد؛ بلکه در زبان‌های تصویری مثل چینی هم خوب عمل می‌کند.

نمونه تصاویر هوش مصنوعی Qwen-Image

مدل Qwen-Image می‌تواند پاراگراف‌های پیچیده و چندخطی و محتوای دوزبانه را خیلی خوب به تصویر بکشد.

این قابلیت کاربردهای زیر و بیشتر را دارد:

  • تولید پوستر فیلم
  • اسلایدهای ارائه
  • صحنه‌های فروشگاهی
  • شعر دست‌نویس
  • اینفوگرافی

طبق نتایج تست‌های اولیه دقت در نمایش متن و پیروی از پرامپت در Qwen-Image چندان بهتر از Midjourney نیست؛ ولی برخلاف آن که فقط تعداد کمی تصویر رایگان می‌سازد، کاملا رایگان و متن‌باز است.

کوئن ایمج در چندین پلتفرم منتشر شده است:

نمونه تصاویر هوش مصنوعی Qwen-Image

هوش مصنوعی Qwen-Image تحت لیسانس Apache 2.0 است که یعنی با ذکر منبع استفاده‌ی تجاری و غیرتجاری از آن آزاد است.

با این حال، به‌علت شفاف نبودن مدل درباره‌ی داده‌هایی که بر اساس آن آموزش دیده، ممکن است شرکت‌ها برای استفاده از آن مردد باشند. همچنین Qwen-Image برخلاف Adobe Firefly و GPT-4o هیچ تضمینی بابت مشکلات حقوقی احتمالی نداده است.

به‌تازگی در خبرها خوانده بودیم که نسخه جدید هوش مصنوعی تصویرساز دیگری به‌نام Pixverse منتشر شده است.