پیش از این حرف و حدیث‌هایی درباره غافلگیری بزرگ کمپانی OpenAI در روز دوشنبه ۱۳ می به گوش می‌رسید،‌ بعضی‌ها معتقد بودند این غافلگیری قرار است یک موتور جستجوی رقیب گوگل باشد،‌ بعضی فکر می‌کردند که معرفی chatgpt5 باشد؛‌ اما هیچکدام نبود! اکنون مشخص شده که غافلگیری بزرگ و شگفت انگیز OpenAI در روز دوشنبه، یک هوش مصنوعی چند وجهی بسیار قدرتمند و جادویی است!

درباره مدل چندوجهی جدید OpenAI

این مدل هوش مصنوعی چند وجهی است،‌ به این معنا که علاوه بر توانایی پردازش داده‌های متنی یا تصویری،‌ قادر است محیط پیرامون را با دوربینش ببیند و صداها را با میکروفون خود بشنود!

به نقل از theinformation مدل چند وجهی جدید OpenAI می‌تواند با کاربر صحبت کند،‌ دستورهای کاربر را بشنود، محیط را ببیند و با سرعت و دقت بالایی داده‌های ورودی از طریق دوربین و میکروفون را پردازش کند. به نظر می‌رسد این مدل چند وجهی جدید OpenAI آنقدر پیشرفته است که حتی لحن و تُن صدای کاربر را تشخیص می‌دهد،‌ مثلا متوجه می‌شود که فردی در حال صحبت شوخی یا طعنه آمیز است!

این مدل می‌تواند کاربردهای مختلفی داشته باشد مثلا در کلاس‌های درس به دانش آموزان کمک کند یا به جای کاربر در جامعه ارتباط برقرار کند!

طبق گزارشی که منتشر شده این مدل در پاسخگویی به سوالات بهتر از چت جی‌پی‌تی۴ عمل می‌کند اما با این حال احتمال پاسخ‌های اشتباه و خطاهای بزرگ وجود دارد.

طبق منابع آگاه،‌ مدل چندوجهی جدید OpenAI احتمالاً تا چند ماه دیگر (قبل از پایان سال ۲۰۲۴) به صورت عمومی در دسترس قرار گیرد.