Kling AI از ابزارهای جدید ساخت عکس و ویدیو با هوش مصنوعی خود با نام‌های IMAGE O1 و VIDEO O1 رونمایی کرد. این ابزارها اکنون در پلتفرم Kling O1 قرار گرفته‌اند تا تجربه‌ای منسجم از خلاقیت با AI را رقم بزنند.

Soundcloud

جدیدترین اخبار تکنولوژی هوش مصنوعی و شبکه‌های اجتماعی را در نامبرلند بخوانید.

IMAGE O1 می‌تواند متن، تا ۱۰ عکس مرجع، طرح‌های دوبعدی اولیه و حتی بخش‌های انتخاب‌شده‌ی داخل تصویر موردنظر را به‌طور هم‌زمان ترکیب کند و در نهایت تصویری یک‌دست، دقیق و منسجم تولید کند.

به‌عنوان مثال، می‌توانید یک عکس از خودتان را به‌همراه چند عکس لباس، بک‌گراند‌های مختلف و حتی تصویر دوستانتان را آپلود کنید و سپس به IMAGE O1 بگویید که آن‌ها را با هم ترکیب کند و عکس‌های متنوعی را در شرایط مختلف نورپردازی و زاویه‌های گوناگون تولید کند. نکته‌ی مهم در اینجا مثل استفاده از هر ابزار هوش مصنوعی دیگر، نوشتن پرامپت‌های دقیق و جزئی است.

در ویدیوی تبلیغاتی کلینگ، نمونه‌هایی نمایش داده می‌شود که IMAGE O1 جزئیات ظریف لباس‌ها را بدون تغییر حفظ می‌کند، چند عکس را به‌شکلی حرفه‌ای ترکیب می‌کند یا از روی یک پلان ساده، رندر سه‌بعدی کاملی می‌سازد.

ابزار ویدیوساز VIDEO O1 قادر است ورودی‌های متنی و تصویری را به ویدیوهای کوتاه تا ۱۰ ثانیه و وضوح 1080p تبدیل کند. ابزار ساخت ویدیو کلینگ امکان تولید یک کلیپ متحرک از روی دو عکس را که به‌عنوان فریم‌های ابتدایی و انتهایی به آن داده شده‌اند فراهم کرده است.

ویژگی‌های ابزار هوش مصنوعی IMAGE O1

به‌گفته‌ی کلینگ، مدل IMAGE O1 برای حوزه‌هایی مثل مد و طراحی لباس، معماری، انیمیشن، تبلیغات و طراحی عکس از محصول عملکرد ویژه‌ای دارد. این مدل تصویرساز با وعده‌ی حفظ ویژگی عناصر عکس‌های مرجع در تصویر نهایی، قابلیت حرکت زاویه‌دید و درک محیط فیزیکی، می‌تواند به ابزار محبوبی در زمینه‌ی تولید عکس‌های حرفه‌ای تبدیل شود.

  • جداکردن یک بخش خاص از عکس: می‌تواند با @ مشخص کند کدام عنصر از کدام عکس مرجع در خروجی استفاده شود. به‌عنوان مثال «کلاه از image1@، پس‌زمینه از image2@». این قابلیت، ترکیب دقیق‌تر اجزا را فراهم می‌کند و سازندگان را از فرایندهای پیچیده‌ی ادیت جداگانه بی‌نیاز می‌سازد.
  • حفظ دقیق ویژگی‌ها: می‌تواند تا ۱۰ تصویر مرجع را بررسی و ویژگی‌های اصلی هرکدام از جمله طرح کلی سوژه، عناصر کلیدی و رنگ را با دقت استخراج کند. این مدل هنگام تولید چند تصویر پشت‌سرهم یا خروجی‌گرفتن از منابع مختلف، یک‌دستی و ثبات ظاهری را حفظ می‌کند.
  • ویرایش جزئیات: کافی است یک دستور متنی بدهید تا حذف، اضافه یا تغییر اشیا و کاراکترها را با دقت انجام دهد. این ویرایش‌ها بدون به‌هم‌ریختن ساختار عکس، نورپردازی و بافت اصلی تصویر اجرا می‌شوند و خروجی نهایی کاملاً طبیعی و منسجم به‌نظر می‌رسد.
  • کنترل دقیق سبک و تُن: می‌تواند سبک اصلی تصاویر مرجع را با دقت تحلیل کند و جزئیاتی مانند نوع قلم‌مو، ترکیب رنگ‌ها و منطق ترکیب‌بندی را به‌صورت عمیق استخراج ‌کند. نتیجه این است که مدل قادر است بازآفرینی سبک، ترکیب طبیعی چند حالت مختلف و بازطراحی یک‌دست را بدون نقص انجام دهد.
  • تنظیم ابعاد عکس: می‌توانید عکس‌های با وضوح دو مگاپیکسل و نسبت‌‌های مختلف را تولید کنید.
تغییر عکس به سبک‌های مختلف با IMAGE O1
تغییر عکس به سبک‌های مختلف با IMAGE O1

کلینگ می‌گوید Kling O1 برای تولید «محیط کاری یک‌پارچه» طراحی شده است. کاربر می‌تواند از همان ابتدا با یک طرح ساده شروع کند، خروجی بگیرد، در صورت نیاز آن را ویرایش کند، حرکات دوربین یا انیمیشن اضافه کند و همه‌ی این‌ها را بدون جابه‌جایی بین ابزار مختلف انجام دهد.

کلینگ اعلام کرد که برخی پلتفرم‌ها مانند Artlist و Higgsfield بلافاصله پس از رونمایی، API مدل‌ Image O1 را به سرویس‌های خود متصل کرده‌اند تا کاربران بتوانند بلافاصله از قابلیت‌های آن استفاده کنند.

با ارائه IMAGE O1 و VIDEO O1، کلینگ می‌خواهد جایگاه خود را از ارائه‌دهنده‌ی ابزار ساخت ویدیو با AI به پلتفرم جامع خلاقیت ارتقا دهد؛ جهتی که می‌تواند رقابت در بازار مدل‌های مولد تصویر و ویدئو را در ماه‌های آینده تشدید کند.

از سوی دیگر، استارتاپ فرانسوی میسترال هوش مصنوعی Mistral 3 را در قالب خانواده‌ای از مدل‌های متن‌باز با امکانات مختلف رونمایی کرد.