غول تکنولوژی چین‌ها شرکت علی‌بابا به‌تازگی اعلام کرده مدل هوش مصنوعی ویدیوساز و تصویر خود که با نام هوش مصنوعی Wan 2.1 شناخته می‌شود،‌ اکنون به‌صورت متن‌باز برای همه کاربران در دسترس است. این اقدام چینی‌ها دوباره آتش صنعت هوش مصنوعی را بیشتر می‌کند و باعث تشدید رقابت در حوزه هوش مصنوعی خواهد شد. ویدیوی زیر را ببینید که با هوش مصنوعی Wan 2.1 ساخته شده است:

علی‌بابا اعلام کرد که چهار نسخه از هوش مصنوعی Wan 2.1 را منتشر کرده است:

  • T2V-1.3B
  • T2V-14B
  • I2V-14B-720P
  • I2V-14B-480P

به گفته reuters،‌ این مدل‌ها می‌توانند با پرامپت‌های متنی و تصویری، هم ویدیو و هم تصویر بسازند. عدد «14B» در برخی از این نسخه‌ها نشان‌دهنده پشتیبانی از ۱۴ میلیارد پارامتر است که امکان پردازش ورودی‌های بسیار بیشتری را فراهم می‌کند و دقت خروجی‌ها را افزایش می‌دهد.

هوش مصنوعی Wan2.1 که اوایل امسال معرفی شد، اولین مدل تولید ویدیویی است که از افکت‌های متنی در دو زبان چینی و انگلیسی پشتیبانی می‌کند. این مدل می‌تواند حرکات پیچیده را با رعایت اصول فیزیکی پردازش کند و محتواهای بسیار واقع‌گرایانه بسازد.

این مدل‌ها اکنون به‌صورت جهانی روی پلتفرم‌های ModelScope در علی‌بابا کلود و HuggingFace برای استفاده‌های آکادمیک، تحقیقاتی و تجاری در دسترس هستند.

شرکت علی‌بابا به‌تازگی هم از سرمایه‌گذاری حداقل ۳۸۰ میلیارد یوانی (برابر با ۵۲ میلیارد دلار) طی سه سال آینده خبر داده است؛‌ به این هدف که زیرساخت‌های رایانش ابری و هوش مصنوعی خود را بیشتر تقویت کنند.

پیش از این هم دیده بودیم که هوش مصنوعی Veo 2 گوگل در Freepik فعال شده است.