فرض کنید به هوش مصنوعی می‌گویید: «من را بگذار وسط یک شهر برفی با یک درخت غول‌پیکر وسطش» و گوگل همان لحظه یک دنیای سه‌بعدی واقعی برای شما می‌سازد. اگر باورتان نمی‌شود، ابتدا این ویدیو را ببینید:

مهم‌ترین نکات درباره‌ی مدل Genie 3

  1. تبدیل متن به دنیای سه‌بعدی: با یک جمله ساده، محیط سه‌بعدی کامل ساخته می‌شود.
  2. محیط کاملاً تعاملی با فیزیک زنده: امکان راه‌رفتن، پریدن و برخورد با اشیاء.
  3. نورپردازی و گرافیک واقعی: نورپردازی، سایه و فیزیک شبیه دنیای واقعی.
  4. حافظه تصویری کوتاه‌مدت (Visual Memory): مدل جای اشیاء را به‌خاطر می‌سپارد.
  5. یادگیری از ویدیوهای واقعی: با دیدن ویدیوها، قوانین فیزیکی را یاد گرفته.
  6. قابلیت تغییر شرایط محیطی: می‌توان شرایط محیط (مثلاً آب‌وهوا) را تغییر داد.
  7. افزودن اجزای زنده یا متحرک: قابلیت اضافه‌کردن موجودات یا اشیاء جدید.
  8. نسخه فعلی فقط برای پژوهشگران است: فعلاً فقط برای محققان منتشر شده.

این مدل هوش مصنوعی که Genie 3 نام دارد، از ویدیوهای واقعی برای آموزش استفاده می‌کند. یعنی می‌داند که دنیای واقعی چگونه پیش می‌رود. این مدل با ساخت «جهان‌های پویا» نه‌تنها صحنه‌های زیبا، بلکه تعامل‌های واقعی خلق می‌کند.

براساس گزارش Verge، برخلاف مدل‌های قبلی، Genie 3 حافظه‌ی تصویری کوتاه‌مدت دارد، یعنی موقعیت اشیاء را به‌خاطر می‌سپارد و اجازه می‌دهد تعامل‌های طبیعی‌تری شکل بگیرد. این مدل هوش مصنوعی را که تیم تحقیقاتی DeepMind توسعه داده‌ است، نقطه عطفی در حوزه‌ی «مدل‌های دنیاساز» (World Models) به‌شمار می‌رود.