کنفرانس Google I/O 2025، فقط شامل معرفی مدل هوش مصنوعی Imagen 4 نبود، بلکه چندین و چند مدل جذاب دیگر هم معرفی شد! یکی از محصولات بسیار شگفتانگیز و جذابی که دیشب معرفی شد، نسخه جدید مدل ویدیوساز گوگل به نام هوش مصنوعی Veo 3 است. مدل Veo 3 نهتنها میتواند ویدیو تولید کند، بلکه صداهای هماهنگ با ویدیو مثل افکت صوتی، صدای پسزمینه و حتی دیالوگ هم میسازد.
ویدیوی زیر را ببینید:
پایان دوره تولید ویدیوهای بیصدا با مدل Veo 3
مدلهای ویدیوساز زیادی تاکنون معرفی شدهاند اما بیشتر آنها یک مشکل تکراری داشتند: فقط ویدیوهای بیصدا تولید میکردند و کاربر مجبور بود جداگانه یک فایل صوتی را روی ویدیو قرار دهد. البته هوش مصنوعی Veo 3 دیگر قرار نیست این مشکل را داشته باشد! دمیس هسابیس، مدیرعامل DeepMind، در این مراسم گفت:
«برای اولین بار داریم از دوران تولید ویدیوهای بیصدا با هوش مصنوعی خارج میشویم.»
او توضیح داد که کاربران میتوانند با یک توضیح ساده دربارهی شخصیتها، محیط و لحن دیالوگ، محتوای ویدیویی کامل با صدا بسازند.
ما در مقاله «هوش مصنوعی ساخت ویدیو» مدلهای هوش مصنوعی مختلفی که کار تولید ویدیو را انجام میدهند کامل و جامع معرفی کردهایم.
ویژگیهای هوش مصنوعی Veo 3
هوش مصنوعی Veo 3 برخلاف مدلهای قبلی یا رقیبان توانایی درک پیکسلهای خام ویدیویی و هماهنگسازی خودکار صدا با تصویر را دارد. همچنین به گفته وبلاگ گوگل، نسبت به مدل قبلی (یعنی مدل Veo 2) کیفیت بصری بالاتری هم ارائه میدهد.
از هفته آینده، کاربران طرح AI Ultra میتوانند از مدل Veo 3 در اپلیکیشن Gemini استفاده کنند. این مدل میتواند هم پرامپت متنی یا تصویری بگیرد و ویدیوهایی با صدا بسازد.
همچنین نکته خوبی که درباره مدل Veo 3 وجود دارد این است که برای جلوگیری از ساخت دیپفیکهای مجرمانه روی ویدیوهای تولیدشده با Veo 3، واترمارک نامرئی SynthID را قرار میدهد.