خبر تکمیلی: مدل هوش مصنوعی Veo از گوگل، آپدیت جدیدی دریافت کرده و به نسخه Veo 2 ارتقا یافته است. بیایید ببینیم در نسخه جدید چه خبر است و این مدل چه پیشرفتهایی کرده است؟
طبق اعلام گوگل، مدل Veo 2 درک بهتری از فیزیک دنیای واقعی و ظرافتهای حرکت و حالتهای چهره انسان دارد. این مدل در پلتفرم VideoFX در Google Labs عرضه شده؛ اما در حال حاضر فقط تعداد محدودی از کاربران که قبلا در لیست انتظار ثبتنام کرده بودند، به آن دسترسی پیدا کردند.
ویدیوی زیر را ببینید که با نسخه جدید هوش مصنوعی Veo ساخته شده؛ اما ایرادات زیادی دارد:
گوگل در وبلاگ خودش درباره نسخه جدید هوش مصنوعی Veo اینطور گفته:
«Veo 2 زبان سینما را میفهمد: از آن بخواهید یک ژانر مشخص، لنز خاص یا افکتهای سینمایی را اعمال کند و Veo 2 این کار را با کیفیت 4K انجام خواهد داد.»
ویدیوهای تولیدشده با Veo 2 دارای واترمارک دیجیتالی گوگل (SynthID) خواهند بود تا قابل شناسایی باشند. گوگل میگوید که این مدل ممکن است همچنان دچار خطاهایی مانند تولید انگشتان اضافه شود؛ اما در عین حال وعده میدهد که میزان این اشتباهات در مقایسه با مدلهای قبلی حتما کمتر شده است.
Veo 2 قرار است با مدل هوش مصنوعی Sora از OpenAI رقابت کند و نظر فیلمسازان و تولیدکنندگان محتوا را به خود جلب کند. مدل Sora مدتی در نسخه پیشنمایش قرار داشت و اکنون برای مشترکان OpenAI در دسترس است.
درباره نسخه اول هوش مصنوعی Veo
بهار امسال رویداد بسیار بزرگ و مهم گوگل به نام کنفرانس سالانه توسعهدهندگان Google I/O برگزار شد و در این مراسم، گوگل از چندین مدل هوش مصنوعی جدید رونمایی کرد؛ که یکی از این مدلها، هوش مصنوعی Veo بود!
شروع یک انقلاب بزرگ: هوش مصنوعیهای ویدیوساز
سال ۲۰۲۳ سالی بود که کمپانی های هوش مصنوعی، از مدلهای ساخت عکس با هوش مصنوعی رونمایی و جهان را بسیار شگفتزده کردند؛ اما به نظر میرسد در سال ۲۰۲۴ نوبت به هوش مصنوعیهای ویدیوساز رسیده که دنیا را انگشت به دهان کنند. پس از اینکه OpenAI از هوش مصنوعی Sora رونمایی کرد، هفته گذشته گوگل هم هوش مصنوعی Veo را به عنوان رقیب Sora منتشر کرد.
از هوش مصنوعی Veo چه میدانیم؟
هوش مصنوعی Veo در حال حاضر پیشرفتهترین ابزار هوش مصنوعی ویدیوساز دنیاست که قادر است ویدیوهایی با وضوح 1080p و طولانیتر از ۶۰ ثانیه تولید کند!
به نقل از وبلاگ deepmind گوگل ادعا میکند که علاوهبر خروجی بسیار باکیفیت، هوش مصنوعی Veo سطح بیسابقهای از خلاقیت را دارد که کاربرانش را از دیگر ابزارهای هوش مصنوعی بینیاز میکند.
درک عمیقتر این مولد هوش مصنوعی از زبان طبیعی، Veo را قادر ساخته تا جزئیات بیشتری از پرامپت کاربرانش را درک کند و ویدیوهای بسیار دقیقتری بسازد.
هوش مصنوعی Veo حتی میتواند اصطلاحات سینمایی مانند «تایم لپس» یا «نمای هوایی» را درک کند.
دسترسی به هوش مصنوعی Veo
این مدل در پلتفرم VideoFX در Google Labs عرضه شده؛ اما در حال حاضر فقط تعداد محدودی از کاربران که قبلا در لیست انتظار ثبتنام کرده بودند، به آن دسترسی پیدا کردند.
در کنفرانس بزرگ گوگل علاوهبر این مدل، از هوش مصنوعی Imagen 3 هم رونمایی کرد که با کیفیتترین مدل تبدیل متن به تصویر تا به امروز است و یک رقیب قدرتمند برای دیگر مدلها به حساب میآید.
کسی جلوی اینا رو نمیگیره؟