خبر تکمیلی: مدل هوش مصنوعی Veo از گوگل،‌ آپدیت جدیدی دریافت کرده و به نسخه Veo 2 ارتقا یافته است. بیایید ببینیم در نسخه جدید چه خبر است و این مدل چه پیشرفت‌هایی کرده است؟

طبق اعلام گوگل، مدل Veo 2 درک بهتری از فیزیک دنیای واقعی و ظرافت‌های حرکت و حالت‌های چهره انسان دارد. این مدل در پلتفرم VideoFX در Google Labs عرضه شده؛ اما در حال حاضر فقط تعداد محدودی از کاربران که قبلا در لیست انتظار ثبت‌نام کرده‌ بودند، به آن دسترسی پیدا کردند.

ویدیوی زیر را ببینید که با نسخه جدید هوش مصنوعی Veo ساخته شده؛ اما ایرادات زیادی دارد:

گوگل در وبلاگ خودش درباره نسخه جدید هوش مصنوعی Veo این‌طور گفته:

«Veo 2 زبان سینما را می‌فهمد: از آن بخواهید یک ژانر مشخص، لنز خاص یا افکت‌های سینمایی را اعمال کند و Veo 2 این کار را با کیفیت 4K انجام خواهد داد.»

ویدیوهای تولیدشده با Veo 2 دارای واترمارک دیجیتالی گوگل (SynthID) خواهند بود تا قابل شناسایی باشند. گوگل می‌گوید که این مدل ممکن است همچنان دچار خطاهایی مانند تولید انگشتان اضافه شود؛ اما در عین حال وعده می‌دهد که میزان این اشتباهات در مقایسه با مدل‌های قبلی حتما کمتر شده است.

Veo 2 قرار است با مدل هوش مصنوعی Sora از OpenAI رقابت کند و نظر فیلم‌سازان و تولیدکنندگان محتوا را به خود جلب کند. مدل Sora مدتی در نسخه پیش‌نمایش قرار داشت و اکنون برای مشترکان OpenAI در دسترس است.

درباره نسخه اول هوش مصنوعی Veo

بهار امسال رویداد بسیار بزرگ و مهم گوگل به نام کنفرانس سالانه توسعه‌دهندگان Google I/O برگزار شد و در این مراسم، گوگل از چندین مدل هوش مصنوعی جدید رونمایی کرد؛‌ که یکی از این مدل‌ها،‌ هوش مصنوعی Veo بود!

شروع یک انقلاب بزرگ:‌ هوش مصنوعی‌های ویدیوساز

سال ۲۰۲۳ سالی بود که کمپانی های هوش مصنوعی،‌ از مدل‌های ساخت عکس با هوش مصنوعی رونمایی و جهان را بسیار شگفت‌زده کردند؛ اما به نظر می‌رسد در سال ۲۰۲۴ نوبت به هوش مصنوعی‌های ویدیوساز رسیده که دنیا را انگشت به دهان کنند. پس از اینکه OpenAI از هوش مصنوعی Sora رونمایی کرد، هفته گذشته گوگل هم هوش مصنوعی Veo را به عنوان رقیب Sora منتشر کرد.

از هوش مصنوعی Veo چه می‌دانیم؟

هوش مصنوعی Veo در حال حاضر پیشرفته‌ترین ابزار هوش مصنوعی ویدیوساز دنیاست که قادر است ویدیوهایی با وضوح 1080p و طولانی‌تر از ۶۰ ثانیه تولید کند!

به نقل از وبلاگ deepmind گوگل ادعا می‌کند که علاوه‌بر خروجی بسیار باکیفیت، هوش مصنوعی Veo سطح بی‌سابقه‌ای از خلاقیت را دارد که کاربرانش را از دیگر ابزارهای هوش مصنوعی بی‌نیاز می‌کند.

درک عمیق‌تر این مولد هوش مصنوعی از زبان طبیعی، Veo را قادر ساخته تا جزئیات بیشتری از پرامپت کاربرانش را درک کند و ویدیوهای بسیار دقیق‌تری بسازد.

هوش مصنوعی Veo حتی می‌تواند اصطلاحات سینمایی مانند «تایم لپس» یا «نمای هوایی» را درک کند.

دسترسی به هوش مصنوعی Veo

این مدل در پلتفرم VideoFX در Google Labs عرضه شده؛ اما در حال حاضر فقط تعداد محدودی از کاربران که قبلا در لیست انتظار ثبت‌نام کرده‌ بودند، به آن دسترسی پیدا کردند.

در کنفرانس بزرگ گوگل علاوه‌بر این مدل، از هوش مصنوعی Imagen 3 هم رونمایی کرد که با کیفیت‌ترین مدل تبدیل متن به تصویر تا به امروز است و یک رقیب قدرتمند برای دیگر مدل‌ها به حساب می‌آید.