اگر تصور می‌کنید که هوش مصنوعی Veo 3 گوگل یا سورا ۲ اوپن‌ای‌آی بهترین ویدیوها را می‌سازند، بهتر است بدانید که مدل ویدیوساز Gen-4.5 از Runway در حال حاضر به‌عنوان «بهترین مدل هوش مصنوعی برای تولید ویدیو از متن و عکس» شناخته می‌شود.

Soundcloud

جدیدترین اخبار تکنولوژی هوش مصنوعی و شبکه‌های اجتماعی را در نامبرلند بخوانید.

مدل Gen-4.5 ران‌وی به‌محض انتشار، جهشی چشمگیر در کیفیت ویدیوها نشان داد و توانست صدر جدول Video Arena را از آنِ خود کند. طبق ادعای Runway، این مدل در بنچمارک ELO امتیاز حدود ۱۲۴۷ را به‌دست آورد و بالاتر از رقبای مطرحی مانند Veo 3 گوگل و Sora 2 Pro اوپن‌ای‌آی قرار گرفت. Elo نشان می‌دهد که کاربران در مقایسه‌ی کور بین دو مدل، خروجی کدام‌یک را ترجیح می‌دهند.

امتیاز Gen-4.5، سورا ۲ پرو و Veo 3.1 در Elo
امتیاز Gen-4.5، سورا ۲ پرو و Veo 3.1 در Elo

در مدل‌های ویدیوساز، امتیاز ELO معمولاً براساس مواردی نظیر طبیعی بودن حرکت‌ها، کیفیت و ثبات چهره و دست، وضوح و جزئیات، تطابق خروجی با پرامپت، پایداری شخصیت‌ها، انیمیشن و فیزیک واقعی‌تر و جذابیت کلی صحنه تعیین می‌شود.

Runway می‌گوید:

«Gen-4.5 به دقت فیزیکی و شفافیت بصری بی‌سابقه‌ای دست پیدا کرده است. این مدل جدید توانایی بهتری در تبعیت دقیق از پرامپت‌ها دارد و می‌تواند صحنه‌های پیچیده و پُرجزئیات را بدون افت کیفیت ویدیو تولید کند.»

مهمترین ویژگی‌های مدل Gen-4.5

طبق اطلاعات منتشرشده، مدل Gen-4.5 نسبت‌به نسل قبلی چند ارتقاء جدی ارائه می‌دهد. یکی از مهم‌ترین پیشرفت‌ها، طبیعی‌تر و سینمایی‌تر شدن حرکت دوربین است؛ موضوعی که باعث می‌شود ویدیوهای تولیدشده حس واقعی‌تری داشته باشند. علاوه بر این، فیزیک محیط، تعامل اجسام و رفتار عناصر صحنه به‌مراتب دقیق‌تر شده است و مدل اکنون می‌تواند ثبات کاراکترها را بهتر حفظ کند.

تصویر یک مرد متعجب با هوش مصنوعی Runway
صحنه‌ای از یک کلیپ ساخته‌شده با Runway Gen-4.5

Gen-4.5 درک بهتری از پرامپت‌های طولانی، پیچیده و چندمرحله‌ای دارد. این مدل قادر است تغییرات زمان‌بندی‌شده در صحنه، حرکت‌های پی‌درپی یا دستورهای مرحله‌به‌مرحله را بدون افت کیفیت اجرا کند؛ قابلیتی که آن را به ابزار مناسب‌تری برای تولید ویدیوهای داستانی یا تبلیغاتی تبدیل می‌کند.

Runway می‌گوید که انتشار مدل Gen 4.5 به‌صورت تدریجی انجام می‌شود. کاربران پلن‌های Pro و Unlimited از امروز به این مدل دسترسی کامل پیدا می‌کنند. مدل Gen-4 نیز اکنون برای تمام کاربران رایگان در دسترس قرار گرفته است.

شناخت گوگل از کاربران از طریق موتور جستجو، جیمیل، درایو و سایر ابزارهای این شرکت موجب شده است که امکان ارائه‌ی پیشنهادات شخصی‌سازی‌شده‌‌تری توسط هوش مصنوعی Gemini در نتایج سرچ گوگل فراهم شود.