خبر تکمیلی: گوگل تصمیم گرفته هوش مصنوعی Veo را به نسخه وب و اپلیکیشن Gemini اضافه کند؛ البته قرار است در ابتدا فقط برای کاربران پولی در دسترس باشد اما در آینده‌ای نزدیک، یک «حالت استفاده رایگان» هم اضافه شود.

هوش مصنوعی Veo می‌تواند ویدیوهایی با طول 8 ثانیه‌ و وضوح 720p بسازد و شما می‌توانید فایل نهایی را با فرمت MP4 دانلود کنید.

قبل‌تر هوش مصنوعی Veo از گوگل،‌ آپدیتی دریافت کرده بود و به نسخه Veo 2 تبدیل شده بود. بیایید ببینیم در نسخه جدید چه خبر است و این مدل چه پیشرفت‌هایی کرده است؟

طبق اعلام گوگل، مدل Veo 2 درک بهتری از فیزیک دنیای واقعی و ظرافت‌های حرکت و حالت‌های چهره انسان دارد. این مدل در پلتفرم VideoFX در Google Labs عرضه شده؛ اما در حال حاضر فقط تعداد محدودی از کاربران که قبلا در لیست انتظار ثبت‌نام کرده‌ بودند، به آن دسترسی پیدا کردند.

ویدیوی زیر را ببینید که با نسخه جدید مدل Veo ساخته شده؛ اما ایرادات زیادی دارد:

گوگل در وبلاگ خودش درباره نسخه جدید هوش مصنوعی Veo این‌طور گفته:

«Veo 2 زبان سینما را می‌فهمد: از آن بخواهید یک ژانر مشخص، لنز خاص یا افکت‌های سینمایی را اعمال کند و Veo 2 این کار را با کیفیت 4K انجام خواهد داد.»

ویدیوهای تولیدشده با Veo 2 دارای واترمارک دیجیتالی گوگل (SynthID) خواهند بود تا قابل شناسایی باشند. گوگل می‌گوید این مدل ممکن است همچنان دچار خطاهایی مانند تولید انگشتان اضافه شود؛ اما در عین حال وعده می‌دهد که میزان این اشتباهات در مقایسه با مدل‌های قبلی حتما کمتر شده است.

Veo 2 قرار است با مدل هوش مصنوعی Sora از OpenAI رقابت کند و نظر فیلم‌سازان و تولیدکنندگان محتوا را به خود جلب کند. مدل Sora مدتی در نسخه پیش‌نمایش قرار داشت و اکنون برای مشترکان OpenAI در دسترس است.

درباره نسخه اول هوش مصنوعی Veo

بهار سال گذشته رویداد بسیار بزرگ و مهم گوگل به نام کنفرانس سالانه توسعه‌دهندگان Google I/O برگزار شد و در این مراسم، گوگل از چندین مدل هوش مصنوعی جدید رونمایی کرد؛‌ که یکی از این مدل‌ها،‌ هوش مصنوعی Veo بود!

از مدل Veo چه می‌دانیم؟

به نقل از وبلاگ deepmind گوگل ادعا می‌کند که علاوه‌بر خروجی بسیار باکیفیت، مدل Veo سطح بی‌سابقه‌ای از خلاقیت را دارد که کاربرانش را از دیگر ابزارهای هوش مصنوعی بی‌نیاز می‌کند.

درک عمیق‌تر این مولد هوش مصنوعی از زبان طبیعی، Veo را قادر ساخته تا جزئیات بیشتری از پرامپت کاربرانش را درک کند و ویدیوهای بسیار دقیق‌تری بسازد.

هوش مصنوعی ویدیوساز Veo حتی می‌تواند اصطلاحات سینمایی مانند «تایم لپس» یا «نمای هوایی» را درک کند.

دسترسی به هوش مصنوعی Veo

این مدل در پلتفرم VideoFX در Google Labs عرضه شده؛ اما در حال حاضر فقط تعداد محدودی از کاربران که قبلا در لیست انتظار ثبت‌نام کرده‌ بودند، به آن دسترسی پیدا کردند.

در کنفرانس بزرگ گوگل علاوه‌بر این مدل، از هوش مصنوعی Imagen 3 هم رونمایی کرد که با کیفیت‌ترین مدل تبدیل متن به تصویر تا به امروز است و یک رقیب قدرتمند برای دیگر مدل‌ها به حساب می‌آید.