هوش مصنوعی Qwen از جدیدترین مدل ویرایش تصویر خود به نام «Image-Edit-2511» رونمایی کرد. این مدل ویژگی‌های قابل‌توجهی در زمینه دقت، پایداری و کاربردهای عملی، افزایش سازگاری در ویرایش و کاهش خطاهایی مثل image drift دارد.

Soundcloud

جدیدترین اخبار تکنولوژی هوش مصنوعی و شبکه‌های اجتماعی را در نامبرلند بخوانید.

نانوبنانا بدون اغراق جزو اولین ابزارهای ساخت و ویرایش تصویری بود که نقطه قوتش حفظ جزئیات چهره و سوژه بود؛ پس از آن سایر ابزراها اعم از Images در چت جی‌پی‌تی هم از این ویژگی بهره بردند.

چینی‌ها که هیچ وقت نمی‌خواهند از رقابت عقب بمانند، آن‌ها نیز با انتشار Qwen-Image-Edit-2511 و اتکا بر قابلیت بهبود چشمگیر حفظ هویت سوژه‌ها رقابت را مهیج‌تر می‌کنند. مهم‌تر این که براساس گزارش‌ها این مدل به‌صورت اوپن‌سورس در دسترس قرار دارد.

با تماشای ویدیو زیر می‌بینید که مدل ویرایش تصویر Qwen می‌تواند ادیت‌های خلاقانه روی پرتره‌ها انجام دهد، بدون اینکه ویژگی‌های بصری یا هویت افراد تغییر کنند. این بهبود فقط در تصاویر تکی نیست و در عکس‌های گروهی هم دیده می‌شود؛ مدل قادر است چند تصویر جداگانه از افراد مختلف را با کیفیت بالا در یک صحنه‌ی واحد و منسجم ترکیب کند.

همچنین:

  • قابلیت‌هایی مثل کنترل نورپردازی واقع‌گرایانه یا تولید زاویه‌های دید جدید بدون هیچ تنظیم اضافه‌ای در مدل جدید Qwen Image-Edit قرار گرفته‌اند.
  • این مدل به‌طور خاص برای سناریوهای مهندسی و طراحی، مجدد آموزش دیده است و از کاردبردهای واقعی و صنعتی برخوردار است.
  • توانایی استدلال هندسی هم تقویت شده است. Qwen-Image-Edit-2511 می‌تواند عناصری مثل خطوط کمکی، خطوط سازه‌ای و اجزای هندسی موردنیاز برای طراحی یا مستندسازی را مستقیماً تولید کند.

اگر کمی از قابلیت‌های ساخت تصویر فاصله بگیریم، منابع متعددی از اضافه شدن قابلیت lecture در notebooklm خبر می‌دهند که هدفش ساخت فایل‌های صوتی تک‌نفره مناسب سخنرانی‌ها و کلاس‌های آموزشی است.