خبر تکمیلی: کمپانی Runway دوباره آپدیت جدیدی داده و با معرفی قابلیت Expand Video، ساخت ویدیو با هوش مصنوعی را بسیار حرفه‌ای‌تر و بهتر از قبل کرده است.

این ویژگی جدید، مشابه قابلیت Outpainting در تصاویر است، اما این بار برای ویدیوها.

اگر با تکنولوژی‌های تولید تصویر آشنا باشید، احتمالاً می‌دانید که در Outpainting، تصویر اولیه می‌تواند گسترش پیدا کند و نسبت ابعاد و زوم آن تغییر کند،‌ بدون اینکه محتوای اصلی تغییر کند. قابلیت Expand Video نیز دقیقاً همین کار را برای ویدیوها انجام می‌دهد.

به عنوان مثال، این ویژگی به شما امکان می‌دهد جلوه‌هایی مانند فوکوس دینامیک و زوم معکوس به ویدیوها اضافه کنید. همچنین اگر در ابتدا ویدیوی خود را به درستی قاب‌بندی نکرده‌اید، می‌توانید از این قابلیت برای افزودن محتوای بیشتر استفاده کنید.

کمپانی Runway قبلا هم هوش مصنوعی ویدیوساز خود یعنی هوش مصنوعی Gen-3 Alpha را آپدیت کرده و این ابزار را بسیار پیشرفته‌تر کرده است. در نسخه جدید Gen-3 Alpha شما می‌توانید پرامپت‌های طولانی‌تر،‌ تا 1000 کاراکتر، بنویسید و ویدیوهای دقیق‌تر،‌ با جزئیات بیشتر و باکیفیت‌تری بسازید.

پرامپت‌های 1000 کاراکتری!

نویسنده مقاله در وبسایت tomsguide ، هوش مصنوعی Gen-3 Alpha را آزمایش کرده تا ببیند آیا استفاده از پرامپت 1000 کاراکتری برای توصیف ویدیو، منجر به تولید ویدیوهای با کیفیت‌تر و واقع‌گرایانه‌تر می‌شود یا خیر؟ در ادامه نمونه خروجی ویدیو با پرامپت کوتاه و بلند را برایتان قرار داده‌ایم.

پرامپت کوتاه: «یک گودال که یک منظره شهری شلوغ را منعکس می‌کند، مردم و وسایل نقلیه در حال عبور هستند، و انگار یک جلوه آینه‌ای از جهان نشان می‌دهد.» خروجی این هوش مصنوعی به این شکل بود:

اما سپس یک پرامپت طولانی با 1000 کاراکتر را امتحان کرد که نتیجه آن بسیار واضح‌تر و بهتر بود!

پرامپت طولانی: «کادر به صورت افقی تنظیم شده باشد و نیمه پایینی گودالی را در پیاده‌روی شهری نشان بده. گودال به عنوان یک آینه عمل می‌کند و منعکس کننده منظره شهری شلوغی است. منظره واقعی شهر نیمه بالایی قاب را اشغال می‌کند و ساختمان‌های مدرن، چراغ‌های راهنمایی و خیابان شلوغ را نشان می‌دهد. پس از چند لحظه پاهای افراد و قسمت های زیرین وسایل نقلیه از قاب تصویر عبور می‌کنند و حرکت آن‌ها موج‌هایی را در گودال ایجاد می‌کند. نورپردازی نشان می‌دهد که ساعت‌های پایانی بعد از ظهر است، با سایه‌های طولانی و نور خورشید طلایی و گرم که از پنجره‌ها و سطح آب می‌درخشد. دنیای منعکس شده در گودال تقریباً پر جنب و جوش‌تر از دنیای واقعی به نظر می‌رسد، با رنگ‌هایی که کمی توسط آب پررنگ می‌شوند. برگ‌ها یا زباله‌های گاه به گاه ممکن است روی گودال شناور شوند و انعکاس را برای مدت کوتاهی مختل کنند. کنار هم قرار گرفتن دوربین ایستا با حرکت مداوم زندگی شهری، یک اثر هیپنوتیزمی ایجاد می کند.»‌

نتیجه اینگونه بود:

پس دیدیم که استفاده از پرامپت‌های طولانی‌تر با توصیف بیشتر، به ویژه برای سناریوهایی که شامل صحنه‌های ثابت و تغییرات تدریجی هستند، منجر به تولید ویدیوهای با جزئیات بیشتر و کیفیت بالاتر می‌شود. نظر شما چیست؟!

پیش از این هم در خبر دیگری مربوط به این هوش مصنوعی خواندیم که ویژگی جدید video to video را معرفی کرده است.