خبر تکمیلی: گوگل تصمیم گرفته هوش مصنوعی Veo را به نسخه وب و اپلیکیشن Gemini اضافه کند؛ البته قرار است در ابتدا فقط برای کاربران پولی در دسترس باشد اما در آیندهای نزدیک، یک «حالت استفاده رایگان» هم اضافه شود.
هوش مصنوعی Veo میتواند ویدیوهایی با طول 8 ثانیه و وضوح 720p بسازد و شما میتوانید فایل نهایی را با فرمت MP4 دانلود کنید.
قبلتر هوش مصنوعی Veo از گوگل، آپدیتی دریافت کرده بود و به نسخه Veo 2 تبدیل شده بود. بیایید ببینیم در نسخه جدید چه خبر است و این مدل چه پیشرفتهایی کرده است؟
طبق اعلام گوگل، مدل Veo 2 درک بهتری از فیزیک دنیای واقعی و ظرافتهای حرکت و حالتهای چهره انسان دارد. این مدل در پلتفرم VideoFX در Google Labs عرضه شده؛ اما در حال حاضر فقط تعداد محدودی از کاربران که قبلا در لیست انتظار ثبتنام کرده بودند، به آن دسترسی پیدا کردند.
ویدیوی زیر را ببینید که با نسخه جدید مدل Veo ساخته شده؛ اما ایرادات زیادی دارد:
گوگل در وبلاگ خودش درباره نسخه جدید هوش مصنوعی Veo اینطور گفته:
«Veo 2 زبان سینما را میفهمد: از آن بخواهید یک ژانر مشخص، لنز خاص یا افکتهای سینمایی را اعمال کند و Veo 2 این کار را با کیفیت 4K انجام خواهد داد.»
ویدیوهای تولیدشده با Veo 2 دارای واترمارک دیجیتالی گوگل (SynthID) خواهند بود تا قابل شناسایی باشند. گوگل میگوید این مدل ممکن است همچنان دچار خطاهایی مانند تولید انگشتان اضافه شود؛ اما در عین حال وعده میدهد که میزان این اشتباهات در مقایسه با مدلهای قبلی حتما کمتر شده است.
Veo 2 قرار است با مدل هوش مصنوعی Sora از OpenAI رقابت کند و نظر فیلمسازان و تولیدکنندگان محتوا را به خود جلب کند. مدل Sora مدتی در نسخه پیشنمایش قرار داشت و اکنون برای مشترکان OpenAI در دسترس است.
درباره نسخه اول هوش مصنوعی Veo
بهار سال گذشته رویداد بسیار بزرگ و مهم گوگل به نام کنفرانس سالانه توسعهدهندگان Google I/O برگزار شد و در این مراسم، گوگل از چندین مدل هوش مصنوعی جدید رونمایی کرد؛ که یکی از این مدلها، هوش مصنوعی Veo بود!
از مدل Veo چه میدانیم؟
به نقل از وبلاگ deepmind گوگل ادعا میکند که علاوهبر خروجی بسیار باکیفیت، مدل Veo سطح بیسابقهای از خلاقیت را دارد که کاربرانش را از دیگر ابزارهای هوش مصنوعی بینیاز میکند.
درک عمیقتر این مولد هوش مصنوعی از زبان طبیعی، Veo را قادر ساخته تا جزئیات بیشتری از پرامپت کاربرانش را درک کند و ویدیوهای بسیار دقیقتری بسازد.
هوش مصنوعی ویدیوساز Veo حتی میتواند اصطلاحات سینمایی مانند «تایم لپس» یا «نمای هوایی» را درک کند.
دسترسی به هوش مصنوعی Veo
این مدل در پلتفرم VideoFX در Google Labs عرضه شده؛ اما در حال حاضر فقط تعداد محدودی از کاربران که قبلا در لیست انتظار ثبتنام کرده بودند، به آن دسترسی پیدا کردند.
در کنفرانس بزرگ گوگل علاوهبر این مدل، از هوش مصنوعی Imagen 3 هم رونمایی کرد که با کیفیتترین مدل تبدیل متن به تصویر تا به امروز است و یک رقیب قدرتمند برای دیگر مدلها به حساب میآید.
کسی جلوی اینا رو نمیگیره؟