کنفرانس Google I/O 2025، فقط شامل معرفی مدل هوش مصنوعی Imagen 4 نبود،‌ بلکه چندین و چند مدل جذاب دیگر هم معرفی شد! یکی از محصولات بسیار شگفت‌انگیز و جذابی که دیشب معرفی شد، نسخه جدید مدل ویدیوساز گوگل به نام هوش مصنوعی Veo 3 است. مدل Veo 3 نه‌تنها می‌تواند ویدیو تولید کند، بلکه صداهای هماهنگ با ویدیو مثل افکت صوتی، صدای پس‌زمینه و حتی دیالوگ هم می‌سازد.

ویدیوی زیر را ببینید:

پایان دوره تولید ویدیوهای بی‌صدا با مدل Veo 3

مدل‌های ویدیوساز زیادی تاکنون معرفی شده‌اند اما بیشتر آن‌ها یک مشکل تکراری داشتند: فقط ویدیوهای بی‌صدا تولید می‌کردند و کاربر مجبور بود جداگانه یک فایل صوتی را روی ویدیو قرار دهد. البته هوش مصنوعی Veo 3 دیگر قرار نیست این مشکل را داشته باشد! دمیس هسابیس، مدیرعامل DeepMind، در این مراسم گفت:

«برای اولین بار داریم از دوران تولید ویدیوهای بی‌صدا با هوش مصنوعی خارج می‌شویم.»

او توضیح داد که کاربران می‌توانند با یک توضیح ساده درباره‌ی شخصیت‌ها، محیط و لحن دیالوگ، محتوای ویدیویی کامل با صدا بسازند.

ما در مقاله «هوش مصنوعی ساخت ویدیو»‌ مدل‌های هوش مصنوعی مختلفی که کار تولید ویدیو را انجام می‌دهند کامل و جامع معرفی کرده‌ایم.

ویژگی‌های هوش مصنوعی Veo 3

هوش مصنوعی Veo 3 برخلاف مدل‌های قبلی یا رقیبان توانایی درک پیکسل‌های خام ویدیویی و هماهنگ‌سازی خودکار صدا با تصویر را دارد. همچنین به گفته وبلاگ گوگل، نسبت به مدل قبلی (یعنی مدل Veo 2) کیفیت بصری بالاتری هم ارائه می‌دهد.

از هفته آینده، کاربران طرح AI Ultra می‌توانند از مدل Veo 3 در اپلیکیشن Gemini استفاده کنند. این مدل می‌تواند هم پرامپت متنی یا تصویری بگیرد و ویدیوهایی با صدا بسازد.

همچنین نکته خوبی که درباره مدل Veo 3 وجود دارد این است که برای جلوگیری از ساخت دیپ‌فیک‌های مجرمانه روی ویدیوهای تولیدشده با Veo 3، واترمارک نامرئی SynthID را قرار می‌دهد.