خبر تکمیلی: هوش مصنوعی FLUX.1 با یک ارتقای اساسی، با مدل‌های پیشرفته‌ای چون Ideogram V2، Stable Diffusion 1.5 و Midjourney Retexture رقابت می‌کند.

چند ماه پیش بود که بزرگترین مدل هوش مصنوعی تبدیل متن به تصویر منبع باز دنیا به نام هوش مصنوعی Flux توسط کمپانی Black Forest Labs به جهان معرفی شد! اما امروز به نسخه FLUX 1.1 ارتقا پیدا کرده و بار دیگر مرزهای خلاقیت را جابه‌جا کرده است.

مثلا تصویر زیر را ببینید،‌ باورتان می‌شود این مرد ساخته هوش مصنوعی باشد و در حقیقت وجود خارجی ندارد؟!

درباره نسخه جدید هوش مصنوعی Flux

 FLUX برخلاف بیشتر هوش مصنوعی‌های تصویرساز، محدودیتی برای ساخت تصاویر نامناسب ندارد. این ویژگی در کنار قابلیت تولید تصویرهای واقعی، الهام‌بخش برای خلق تصاویر وایرال است. نسخه جدید دو حالت به نام “Raw” و “Ultra” دارد و تولید تصاویر باکیفیت و واقع‌گرایانه را به سطح دیگری برده است!

حالت “Raw” به کاربران امکان می‌دهد تصاویری با ظاهری بسیار طبیعی و شبیه به عکس‌های واقعی بسازند. این حالت با تمرکز بر جزئیات و تنوع در سوژه‌های انسانی، به ویژه در زمینه عکاسی پرتره، عملکردی درخشان از خود نشان می‌دهد.

از سوی دیگر، حالت “Ultra” با افزایش چهار برابری وضوح تصاویر تا 4 مگاپیکسل، بدون اینکه کیفیت کاهش پیدا کند، در مدت زمان بسیار کوتاه (10 ثانیه برای هر تصویر)، تحولی عظیم ایجاد کرده است.

این ویژگی، FLUX 1.1 را به ابزاری قدرتمند برای طراحان، هنرمندان و همه کسانی که به دنبال تولید تصاویر با کیفیت بالا هستند، تبدیل کرده است.

مدل هوش مصنوعی flux قادر است آنچنان تصاویری بسازد که با خروجی‌های midjourney رقابت کنند و احتمالاً هر مدل دیگری،‌ متن‌باز یا بسته را هم با قدرت شکست دهد.

اگر دوست دارید این مدل را امتحان کنید، به این لینک بروید و فقط با یک جیمیل می‌توانید تصویر موردنظرتان را بسازید!

این کمپانی سه نسخه از این مدل را منتشر کرده است که همه روی صفحه اصلی سایت در دسترس هستند:

  • FLUX.1 [dev]  :‌  مدل پایه، منبع باز
  • FLUX.1 [schnell] :‌ یک نسخه از مدل پایه اما با سرعت 10  برابر بیشتر
  •  FLUX.1 [pro] :‌ یک نسخه منبع بسته فقط از طریق API در دسترس است.

هوش مصنوعی flux مرزهای خلاقیت و عملکرد را با 12 میلیارد پارامترش جابجا کرده و یک رقیب جدی برای هوش مصنوعی میدجرنی به حساب ‌می‌آید. مثلا پرامپت یکسانی به هوش مصنوعی flux و میدجرنی داده شد و خروجی هر دو مدل را مشاهده می‌کنید:

عملکرد هوش مصنوعی Flux برای ساختن این تصویر فوق العاده است و حتی در نورپردازی بهتر عمل کرده اما شخصیت دختر یک پا اضافه دارد!

همچنین خبر خوبی که به تازگی برای کاربران ChatGPT آمده این است که دسترسی رایگان به ابزار تصویرساز DALL-E 3 برای کاربران عادی هم فراهم شده است.

معرفی ابزارهای FLUX.1

21 نوامبر، قابلیت FLUX.1 Tools معرفی شد؛ این ابزارها برای ویرایش، کنترل و تغییر تصویر کاربردی‌اند. 4 ابزاری که باعث ارتقای چشمگیر این هوش مصنوعی‌‌اند به شرح زیر است:

Fill: حذف و اضافه‌کردن موارد دلخواه به تصویرها.

Depth: تشخیص عمق پیکسل و عناصر تصاویر.

Canny: تشخیص لبه‌ تصاویر و شرطی‌سازی برای تولید.

Redux: مبدل تصویرهای متعدد به وسیله یک تصویر.

با ویژگی Flux.1 Fill، کاربران می‌توانند قابلیت‌های «inpainting» و «outpainting» را در تصاویر خود به کار بگیرند؛ به این معنی که می‌توانند به طور یکپارچه قسمت‌هایی از تصویر را حذف یا به آن اضافه کنند. Fill تصویر را فراتر از مرزهای قاب اصلی گسترش دهند. همان‌طور که در تصویر زیر دیده می‌شود، تفاوت‌ها به صورت یکپارچه اضافه شده‌اند و به‌طوری که تشخیص آن از تصویر اصلی دشوار است.

 FLUX.1 با قابلیت «Canny» و«Depth» ساختار را شرطی‌‍سازی و نقشه‌برداری کرده و در تولید تصویرهای آینده حفظ می‌کنند.

علاوه بر این، ابزار« Redux» به‌عنوان یک مبدل عمل می‌کند که نسخه‌های جدیدی از یک تصویر موجود با تغییرات جزئی ایجاد کنند.

این ابزارها به‌عنوان مدل‌های دسترسی آزاد در سری مدل‌های FLUX.1 [dev] و FLUX.1 [pro] در دسترس هستند. برای استفاده از ابزار مولد «Redux» می‌توانید از طریق «Grok» (هوش مصنوعی ایلان ماسک) در پلتفرم X با اشتراک Premium یا Premium پلاس دسترسی پیدا کنید.