این روزها مدام اخبار مربوط به پیشرفت هوش مصنوعی در زمینه تولید ویدیو و تصویر را میخوانیم، پس از ترند بسیار پرطرفدار ساخت انیمه به سبک استودیو جیبلی در chatgpt و پس از آن آپدیت مدل هوش مصنوعی Runway Gen-4، اکنون شاهد جلب توجه هوش مصنوعی متا هستیم. متا یک محصول جدید به نام هوش مصنوعی MoCha برای ساخت ویدیو ارائه داده که به قدری خوب است که میتواند شما را فریب دهد! ویدیوی زیر را ببینید:
نام هوش مصنوعی MoCha، اختصاری از Movie Character Animator است، یک پروژه تحقیقاتی از متا و دانشگاه واترلو. ایده اصلی مدل هوش مصنوعی MoCha ساده است: شما یک دستور متنی به هوش مصنوعی میدهید که ویدیو را توصیف میکند و غیر از آن یک فایل صوتی هم به مدل میدهید؛ سپس هوش مصنوعی MoCha برایتان طبق دستور شما ویدیویی میسازد که در حال گفتن حرفهایی است که در فایل صوتی وجود داشته است.
هوش مصنوعی MoCha احساسات را نیز در نظر میگیرد و میتواند از چندین شخصیت در یک صحنه پشتیبانی کند.
به گفته bgr، ویدیوهایی که این مدل ساخته، تقریباً بینقص هستند. البته هنوز خطا و نقصهایی وجود دارد؛ مثلا حرکت چشمها و صورت هنوز خیلی طبیعی نیست و حرکت کلی دهان در مقایسه با انسانهای واقعی اغراقآمیز است؛ اما با اینحال عملکرد مدل بسیار قابلتوجه است که قطعا در آینده هم بهبود مییابد.
محصولاتی مانند هوش مصنوعی MoCha، و یا مدل Runway Gen-4 ممکن است برای ایجاد دیپفیکهای گمراهکننده استفاده شوند.
این وظیفه محققان متا است که این مشکل را برطرف کنند.
همچنین مهم است که دادههایی که متا برای آموزش این هوش مصنوعی استفاده کرده است، مشخص شود. هنوز مشخص نیست که دادههای آموزشی این مدل از کجا آمده و این موضوع نگرانکننده است.