غول فناوری چینی شرکت ByteDance (که صاحب اپلیکیشن پرطرفدار tiktok هم است) بهتازگی همه را در دنیای هوش مصنوعی با شوک مواجه کرده است! آنها بلافاصله پس از معرفی هوش مصنوعی OmniHuman-1 هوش مصنوعی Goku را معرفی کردند که جدیدترین، قویترین و پیشرفتهترین مدل ساخت ویدیو است. ویدیوهای تولیدشده با مدل هوش مصنوعی Goku بسیار طبیعی و واقعی به نظر میرسند و تا به شما نگوییم، باورتان نمیشود ویدیوها ساختگی است! ویدیوی زیر را ببینید:
از هوش مصنوعی Goku چه میدانیم؟
به نقل از aibase، شرکت ByteDance برای برای توسعه Goku AI مدلش را روی یک مجموعهای گسترده از دادهها آموزش داده است. این دادهها از منابع دانشگاهی، محتواهای موجود در اینترنت و منابع دیگر گردآوری شده و از تنوع و جامعیت بالایی برخوردار است.
البته هنوز این مدل به صورت عمومی عرضه نشده و ویدیوهایی که تولید میکند حداکثر ۴ ثانیه با نرخ ۲۴ فریم بر ثانیه و وضوح 720p هستند.
برخلاف برخی مدلهای ویدیوساز دیگر، هوش مصنوعی Goku فرآیند سختگیرانهای برای پالایش دادهها پشت سر گذاشته تا کیفیت محتوای تولیدشده را بسیار بالا ببرد. این امر باعث میشود خروجیهای این مدل بسیار واقعگرایانه و شبیه به محتوای انسانی باشند.
جالب اینکه هوش مصنوعی Goku فقط یک مدل ویدیوساز نیست؛ بلکه تصویر هم تولید میکند! این قابلیت به لطف معماری جدیدی مبتنی بر Transformer که دارای ۲ تا ۸ میلیارد پارامتر است، امکانپذیر شده است. برخلاف مدلهای سنتی تولید ویدیو که به شدت به تکنیکهای انتشار (Diffusion) متکی هستند، هوش مصنوعی Goku از فرآیند تولید جدیدی به نام Rectified Flow استفاده میکند.
این رویکرد باعث بهبود یکپارچگی و افزایش کیفیت کلی محتوای تولیدشده میشود؛ زیرا از تکرارهای نویزی که معمولاً در مدلهای انتشار دیده میشود، جلوگیری میکند.
کاربردهای هوش مصنوعی Goku در دنیای واقعی
ByteDance برای هوش مصنوعی Goku کاربردهای متعددی در صنایع مختلف از جمله تولید محتوای رسانهای، ساخت بازی و مدلسازی دنیای دیجیتال در نظر گرفته است؛ اما یکی از مهمترین کاربردهای تجاری این مدل، تبلیغات است. نسخهای ویژه از این مدل به نام هوش مصنوعی Goku+ بهطور خاص برای تولید محتوای تبلیغاتی توسعه یافته و بر تعامل واقعی انسان با محصولات تمرکز دارد.
با استفاده از Goku+ کسبوکارها میتوانند ویدئوهای تبلیغاتی بسیار واقعی تولید کنند که در آن شخصیتهای ساختگی به نمایش محصولات میپردازند و حرکات چهره، دست و بدن آنها هم بهطور طبیعی شبیهسازی میشود.
توسعهدهندگان هوش مصنوعی Goku ادعا میکنند که تولید محتوای تبلیغاتی با این مدل، هزینه تبلیغات را تا ۹۹ درصد کاهش میدهد!
چشمانداز آینده و چالشهای احتمالی
در حالی که Goku AI یک جهش بزرگ در فناوری تولید ویدئوهای هوش مصنوعی محسوب میشود، هنوز در مرحله تحقیق و توسعه قرار دارد و به صورت عمومی عرضه نشده است. ByteDance فقط نمونههایی از ویدئوهای تولیدشده را در صفحه رسمی این پروژه به نمایش گذاشته است که هم سناریوهای واقعی و هم سناریوهای خلاقانه را شامل میشود. باید ببینیم در آینده این مدل چه عملکردی از خود نشان میدهد و کاربران چقدر از آن راضی خواهند بود.