Kling AI از ابزارهای جدید ساخت عکس و ویدیو با هوش مصنوعی خود با نامهای IMAGE O1 و VIDEO O1 رونمایی کرد. این ابزارها اکنون در پلتفرم Kling O1 قرار گرفتهاند تا تجربهای منسجم از خلاقیت با AI را رقم بزنند.
جدیدترین اخبار تکنولوژی هوش مصنوعی و شبکههای اجتماعی را در نامبرلند بخوانید.
IMAGE O1 میتواند متن، تا ۱۰ عکس مرجع، طرحهای دوبعدی اولیه و حتی بخشهای انتخابشدهی داخل تصویر موردنظر را بهطور همزمان ترکیب کند و در نهایت تصویری یکدست، دقیق و منسجم تولید کند.
بهعنوان مثال، میتوانید یک عکس از خودتان را بههمراه چند عکس لباس، بکگراندهای مختلف و حتی تصویر دوستانتان را آپلود کنید و سپس به IMAGE O1 بگویید که آنها را با هم ترکیب کند و عکسهای متنوعی را در شرایط مختلف نورپردازی و زاویههای گوناگون تولید کند. نکتهی مهم در اینجا مثل استفاده از هر ابزار هوش مصنوعی دیگر، نوشتن پرامپتهای دقیق و جزئی است.
در ویدیوی تبلیغاتی کلینگ، نمونههایی نمایش داده میشود که IMAGE O1 جزئیات ظریف لباسها را بدون تغییر حفظ میکند، چند عکس را بهشکلی حرفهای ترکیب میکند یا از روی یک پلان ساده، رندر سهبعدی کاملی میسازد.
ابزار ویدیوساز VIDEO O1 قادر است ورودیهای متنی و تصویری را به ویدیوهای کوتاه تا ۱۰ ثانیه و وضوح 1080p تبدیل کند. ابزار ساخت ویدیو کلینگ امکان تولید یک کلیپ متحرک از روی دو عکس را که بهعنوان فریمهای ابتدایی و انتهایی به آن داده شدهاند فراهم کرده است.
ویژگیهای ابزار هوش مصنوعی IMAGE O1
بهگفتهی کلینگ، مدل IMAGE O1 برای حوزههایی مثل مد و طراحی لباس، معماری، انیمیشن، تبلیغات و طراحی عکس از محصول عملکرد ویژهای دارد. این مدل تصویرساز با وعدهی حفظ ویژگی عناصر عکسهای مرجع در تصویر نهایی، قابلیت حرکت زاویهدید و درک محیط فیزیکی، میتواند به ابزار محبوبی در زمینهی تولید عکسهای حرفهای تبدیل شود.
- جداکردن یک بخش خاص از عکس: میتواند با @ مشخص کند کدام عنصر از کدام عکس مرجع در خروجی استفاده شود. بهعنوان مثال «کلاه از image1@، پسزمینه از image2@». این قابلیت، ترکیب دقیقتر اجزا را فراهم میکند و سازندگان را از فرایندهای پیچیدهی ادیت جداگانه بینیاز میسازد.
- حفظ دقیق ویژگیها: میتواند تا ۱۰ تصویر مرجع را بررسی و ویژگیهای اصلی هرکدام از جمله طرح کلی سوژه، عناصر کلیدی و رنگ را با دقت استخراج کند. این مدل هنگام تولید چند تصویر پشتسرهم یا خروجیگرفتن از منابع مختلف، یکدستی و ثبات ظاهری را حفظ میکند.
- ویرایش جزئیات: کافی است یک دستور متنی بدهید تا حذف، اضافه یا تغییر اشیا و کاراکترها را با دقت انجام دهد. این ویرایشها بدون بههمریختن ساختار عکس، نورپردازی و بافت اصلی تصویر اجرا میشوند و خروجی نهایی کاملاً طبیعی و منسجم بهنظر میرسد.
- کنترل دقیق سبک و تُن: میتواند سبک اصلی تصاویر مرجع را با دقت تحلیل کند و جزئیاتی مانند نوع قلممو، ترکیب رنگها و منطق ترکیببندی را بهصورت عمیق استخراج کند. نتیجه این است که مدل قادر است بازآفرینی سبک، ترکیب طبیعی چند حالت مختلف و بازطراحی یکدست را بدون نقص انجام دهد.
- تنظیم ابعاد عکس: میتوانید عکسهای با وضوح دو مگاپیکسل و نسبتهای مختلف را تولید کنید.

کلینگ میگوید Kling O1 برای تولید «محیط کاری یکپارچه» طراحی شده است. کاربر میتواند از همان ابتدا با یک طرح ساده شروع کند، خروجی بگیرد، در صورت نیاز آن را ویرایش کند، حرکات دوربین یا انیمیشن اضافه کند و همهی اینها را بدون جابهجایی بین ابزار مختلف انجام دهد.
کلینگ اعلام کرد که برخی پلتفرمها مانند Artlist و Higgsfield بلافاصله پس از رونمایی، API مدل Image O1 را به سرویسهای خود متصل کردهاند تا کاربران بتوانند بلافاصله از قابلیتهای آن استفاده کنند.
با ارائه IMAGE O1 و VIDEO O1، کلینگ میخواهد جایگاه خود را از ارائهدهندهی ابزار ساخت ویدیو با AI به پلتفرم جامع خلاقیت ارتقا دهد؛ جهتی که میتواند رقابت در بازار مدلهای مولد تصویر و ویدئو را در ماههای آینده تشدید کند.
از سوی دیگر، استارتاپ فرانسوی میسترال هوش مصنوعی Mistral 3 را در قالب خانوادهای از مدلهای متنباز با امکانات مختلف رونمایی کرد.
