گزارش‌های جدید حاکی از آن است که ابزار پیشرفته‌ی گراک ایمجین متعلق به شرکت xAI وارد مرحله‌ای تازه شده است. اکنون کاربر می‌تواند تنها با نوشتن چند دستور متنی یا افزودن یک عکس ثابت، ویدیویی کوتاه با صدا تولید کند.

Soundcloud

جدیدترین اخبار تکنولوژی هوش مصنوعی و شبکه‌های اجتماعی را در نامبرلند بخوانید.

براساس مقاله‌ای در وب‌سایت مدیوم، مدل 0.9 Grok Imagine یک جهش بزرگ در خلق محتوای ویدیویی مبتنی‌بر هوش مصنوعی به‌شمار می‌آید؛ این نسخه با معرفی موتور آرورا (Aurora Engine) سرعت تولید و همگام‌سازی صدا و تصویر را به‌ میزان چشم‌گیری ارتقاء داده است.

در این به‌روزرسانی کاربران می‌توانند عکس‌های ثابت را آپلود کنند یا توضیح متنی بدهند، سپس در کمتر از 30 ثانیه ویدیویی شش‌ثانیه‌ای، با صدای مرتبط و حرکت طبیعی تصویر، تحویل بگیرند. 

طبق گزارش سایت خبری Mint، ایلان ماسک، مدیرعامل xAI نشان داده است که تنها با یک فشار طولانی روی عکس در اپلیکیشن گراک، امکان تبدیل عکس به ویدیو را فراهم کرده است.

ایلان ماسک، در پستی در ایکس نوشت:

«روی هر تصویر کمی نگه دارید تا به ویدیو تبدیل شود! سپس با افزودن یک پرامپت متنی هر چیزی را که در ذهنتان هست بسازید.»

از سوی دیگر، xAI اعلام کرد که مدل Grok 4 اکنون به‌صورت رایگان برای تمام کاربران جهان در دسترس است. کاربران می‌توانند از طریق اپلیکیشن ایکس یا اپلیکیشن مستقل گراک در iOS و اندروید به آن دسترسی پیدا کنند.

با این حال، نسخه‌ی رایگان محدودیت‌هایی دارد؛ از جمله تعداد محدود درخواست‌های روزانه و نداشتن برخی امکانات پیشرفته مانند سرعت پاسخ بالاتر، زمینه‌ی گفت‌وگوی طولانی‌تر و حالت حرفه‌ای SuperGrok که فقط برای مشترکان پولی (از جمله کاربران طرح پرمیوم پلاس) فعال است.

ویژگی‌های برجسته‌ی 0.9 Grok Imagine عبارت‌اند از:

  • توضیح متنی یا تصویر ثابت به یک ویدیوی صدادار تبدیل می‌کند.
  • توانایی تولید ویدیوهایی با وضوح بالاتر و نرخ فریم مناسب که حرکت را طبیعی‌تر نشان می‌دهد.
  • نه‌تنها تصویر متحرک می‌شود، بلکه موسیقی پس‌زمینه، دیالوگ یا حتی آواز نیز اضافه می‌شود.
  • آپلود یک عکس یا نوشتن فرمان متنی کافی است تا فرایند ساخت آغاز شود.
  • امکان تولید ویدیو برای کاربردهای مختلف تبلیغاتی، سرگرمی و رسانه‌های اجتماعی وجود دارد.
  • رندر ویدیو در کمتر از 30 ثانیه انجام می‌شود.
  • استایل ویدیو در حالت‌های Normal، Fun و Spicy قابل تنظیم است. 

اگرچه این ابزار امکانات چشم‌گیری دارد، هنوز در دسترس تمامی کاربران قرار نگرفته و ممکن است با محدودیت‌هایی روبرو باشد. به‌هرحال، این حرکت نشان‌دهنده‌ی روندی است که «تولید ویدیو» را از نیاز به تیم‌های بزرگ و بودجه‌های سنگین برطرف کرده و به کاربر عادی اجازه می‌دهد با چند کلیک یا چند خط متن، خروجی قابل‌قبولی تولید کند.

پیشنهاد می‌کنیم خبر مربوط به پیغام امنیتی ایکس (توییتر سابق) در مورد حذف دامنه‌ی توییتر را بخوانید.