این روزها مدام اخبار مربوط به پیشرفت‌ هوش مصنوعی در زمینه تولید ویدیو و تصویر را می‌خوانیم، پس از ترند بسیار پرطرفدار ساخت انیمه به سبک استودیو جیبلی در chatgpt و پس از آن آپدیت مدل هوش مصنوعی Runway Gen-4، اکنون شاهد جلب توجه هوش مصنوعی متا هستیم. متا یک محصول جدید به نام هوش مصنوعی MoCha برای ساخت ویدیو ارائه داده که به قدری خوب است که می‌تواند شما را فریب دهد! ویدیوی زیر را ببینید:

نام هوش مصنوعی MoCha، اختصاری از Movie Character Animator است، یک پروژه تحقیقاتی از متا و دانشگاه واترلو. ایده اصلی مدل هوش مصنوعی MoCha ساده است: شما یک دستور متنی به هوش مصنوعی می‌دهید که ویدیو را توصیف می‌کند و غیر از آن یک فایل صوتی هم به مدل می‌‌دهید؛ سپس هوش مصنوعی MoCha برایتان طبق دستور شما ویدیویی می‌سازد که در حال گفتن حرف‌هایی است که در فایل صوتی وجود داشته است.

هوش مصنوعی MoCha احساسات را نیز در نظر می‌گیرد و می‌تواند از چندین شخصیت در یک صحنه پشتیبانی کند.

به گفته bgr، ویدیوهایی که این مدل ساخته، تقریباً بی‌نقص هستند. البته هنوز خطا و نقص‌هایی وجود دارد؛ مثلا حرکت چشم‌ها و صورت هنوز خیلی طبیعی نیست و حرکت کلی دهان در مقایسه با انسان‌های واقعی اغراق‌آمیز است؛ اما با این‌حال عملکرد مدل بسیار قابل‌توجه است که قطعا در آینده هم بهبود می‌یابد.

محصولاتی مانند هوش مصنوعی MoCha، و یا مدل Runway Gen-4 ممکن است برای ایجاد دیپ‌فیک‌های گمراه‌کننده استفاده شوند.

این وظیفه محققان متا است که این مشکل را برطرف کنند.

همچنین مهم است که داده‌هایی که متا برای آموزش این هوش مصنوعی استفاده کرده است، مشخص شود. هنوز مشخص نیست که داده‌های آموزشی این مدل از کجا آمده و این موضوع نگران‌کننده است.