محققان شرکت بایتدنس (شرکتی که شبکه اجتماعی تیکتاک را ساخته) یک مدل شگفتانگیز و حیرتآور به نام هوش مصنوعی OmniHuman-1 معرفی کردهاند که میتواند واقعگرایانهترین ویدیوهای دیپفیک را تولید کند. ویدیوی زیر را ببینید که چقدر طبیعی و واقعی است، حتی چینوچروکهای لباس هم مشخص است:
چینیها همچنان در حال پیشتازی: هوش مصنوعی OmniHuman-1
دیپ فیک نام یک تکنولوژی مبتنیبر هوش مصنوعی است که میتواند ویدیوهای جعلی واقعگرایانه بسازد؛ اما بیشتر دیپفیکها تا حدی مشخص هستند که واقعی نیستند؛ مثلا نشانه یا علامت واضحی وجود دارد که نشان میدهد در قسمتی از این ویدیو، هوش مصنوعی استفاده شده است.
اما هوش مصنوعی OmniHuman-1 چنین نیست و همه را شوکه کرده است؛ این مدل روی ۱۹,۰۰۰ ساعت محتوای ویدیویی از منابع ناشناخته آموزش دیده است.
طبق گفته محققان بایتدنس، OmniHuman-1 تنها به یک تصویر مرجع و صدا نیاز دارد تا یک ویدیو تولید کند. ابعاد ویدیوی خروجی قابل تنظیم است، همچنین جزییاتی مثل تناسب بدن سوژه یا حرکات اعضای بدن شخص هم قابل تنظیم است.
البته هوش مصنوعی OmniHuman-1 کامل نیست و ایراداتی هم دارد. به نظر میرسد این مدل در ساخت برخی حالتهای بدن مشکل دارد؛ مثلا حرکات عجیب دست را نمیتواند خوب نمایش دهد. ویدیوی زیر را ببینید که رپ خواندن مدیرعامل انویدیا است؛ اما غیرطبیعی بودن آن مشخص است:
شرکت بایتدنس هنوز این مدل را به صورت عمومی منتشر نکرده است؛ چراکه نگرانیهای امنیتی وجود دارد. چند ماه پیش یک زن قربانی کلاهبرداری با دیپ فیکهای برد پیت شد و مبلغ کلانی را از دست داد.
نظر شما درباره چنین فناوریهایی چیست؟