غول فناوری چینی شرکت ByteDance (که صاحب اپلیکیشن پرطرفدار tiktok هم است) به‌تازگی همه را در دنیای هوش مصنوعی با شوک مواجه کرده است! آن‌ها بلافاصله پس از معرفی هوش مصنوعی OmniHuman-1 هوش مصنوعی Goku را معرفی کردند که جدیدترین، قوی‌ترین و پیشرفته‌ترین مدل ساخت ویدیو است. ویدیوهای تولیدشده با مدل هوش مصنوعی Goku بسیار طبیعی و واقعی به نظر می‌رسند و تا به شما نگوییم،‌ باورتان نمی‌شود ویدیوها ساختگی است!‌ ویدیوی زیر را ببینید:

از هوش مصنوعی Goku چه می‌دانیم؟

به نقل از aibase،‌ شرکت ByteDance برای برای توسعه Goku AI مدلش را روی یک مجموعه‌ای گسترده از داد‌ه‌ها آموزش داده است. این داده‌ها از منابع دانشگاهی، محتواهای موجود در اینترنت و منابع دیگر گردآوری شده و از تنوع و جامعیت بالایی برخوردار است.

البته هنوز این مدل به صورت عمومی عرضه نشده و ویدیوهایی که تولید می‌کند حداکثر ۴ ثانیه با نرخ ۲۴ فریم بر ثانیه و وضوح 720p هستند.

برخلاف برخی مدل‌های ویدیوساز دیگر، هوش مصنوعی Goku فرآیند سخت‌گیرانه‌ای برای پالایش داده‌ها پشت سر گذاشته تا کیفیت محتوای تولیدشده را بسیار بالا ببرد. این امر باعث می‌شود خروجی‌های این مدل بسیار واقع‌گرایانه‌ و شبیه به محتوای انسانی باشند.

جالب اینکه هوش مصنوعی Goku فقط یک مدل ویدیوساز نیست؛ بلکه تصویر هم تولید می‌کند! این قابلیت به لطف معماری جدیدی مبتنی بر Transformer که دارای ۲ تا ۸ میلیارد پارامتر است، امکان‌پذیر شده است. برخلاف مدل‌های سنتی تولید ویدیو که به شدت به تکنیک‌های انتشار (Diffusion) متکی هستند، هوش مصنوعی Goku از فرآیند تولید جدیدی به نام Rectified Flow استفاده می‌کند.

این رویکرد باعث بهبود یکپارچگی و افزایش کیفیت کلی محتوای تولیدشده می‌شود؛ زیرا از تکرارهای نویزی که معمولاً در مدل‌های انتشار دیده می‌شود، جلوگیری می‌کند.

کاربردهای هوش مصنوعی Goku در دنیای واقعی

ByteDance برای هوش مصنوعی Goku کاربردهای متعددی در صنایع مختلف از جمله تولید محتوای رسانه‌ای، ساخت بازی و مدل‌سازی دنیای دیجیتال در نظر گرفته است؛ اما یکی از مهم‌ترین کاربردهای تجاری این مدل‌، تبلیغات است. نسخه‌ای ویژه از این مدل به نام هوش مصنوعی Goku+ به‌طور خاص برای تولید محتوای تبلیغاتی توسعه یافته و بر تعامل واقعی انسان با محصولات تمرکز دارد.

با استفاده از Goku+ کسب‌وکارها می‌توانند ویدئوهای تبلیغاتی بسیار واقعی تولید کنند که در آن شخصیت‌های ساختگی به نمایش محصولات می‌پردازند و حرکات چهره، دست و بدن آن‌ها هم به‌طور طبیعی شبیه‌سازی می‌شود.

توسعه‌دهندگان هوش مصنوعی Goku ادعا می‌کنند که تولید محتوای تبلیغاتی با این مدل، هزینه تبلیغات را تا ۹۹ درصد کاهش می‌دهد!

چشم‌انداز آینده و چالش‌های احتمالی

در حالی که Goku AI یک جهش بزرگ در فناوری تولید ویدئوهای هوش مصنوعی محسوب می‌شود، هنوز در مرحله تحقیق و توسعه قرار دارد و به صورت عمومی عرضه نشده است. ByteDance فقط نمونه‌هایی از ویدئوهای تولیدشده را در صفحه رسمی این پروژه به نمایش گذاشته است که هم سناریوهای واقعی و هم سناریوهای خلاقانه را شامل می‌شود. باید ببینیم در آینده این مدل چه عملکردی از خود نشان می‌دهد و کاربران چقدر از آن راضی خواهند بود.