سرانجام مدل هوش مصنوعی Gemini 3 رونمایی شد. طبق ادعای گوگل، این مدل قابلیت‌های بسیار پیشرفته‌تری در زمینه‌ی استدلال، درک متن و تصویر، برنامه‌نویسی و تولیدات چندرسانه‌ای دارد.

Soundcloud

جدیدترین اخبار تکنولوژی هوش مصنوعی و شبکه‌های اجتماعی را در نامبرلند بخوانید.

طبق بیانیه‌ی رسمی گوگل، جمینای 3 برای نخستین‌بار به‌طور هم‌زمان در چند محصول این شرکت از جمله اپلیکیشن جمینای، حالت AI Mode در موتور جستجو، محیط توسعه‌ی AI Studio و پلتفرم کدنویسی Vertex AI عرضه شده است.

گوگل اعلام کرد که جمینای 3 با توانایی‌های چندرسانه‌ای گسترده‌تر، به فهم بهتر منظور کاربران و ارائه‌ی پاسخ‌های دقیق‌تر می‌پردازد. این مدل می‌تواند در بنچمارک‌های متعدد هوش مصنوعی امتیازهای بیشتری از جمینای 2.5 پرو کسب کند.

داده‌های منتشر شده در بلاگ گوگل نشان می‌دهند که نسخه‌ی Pro جمینای 3 در بنچمارک LMArena (ارائه‌ی پاسخ متنی دقیق و انسانی) به امتیاز ۱۵۰۱ دست‌یافته و در آزمون‌های دیگر نیز عملکرد خیره‌کننده‌ای داشته است. این اولین‌بار است که یک مدل AI از مرز 1500 امتیاز در این بنچمارک عبور می‌کند. مدل هوش مصنوعی گراک 4.1 که به‌تازگی رونمایی شده است، تاکنون در صدر این رتبه‌بندی بود و اکنون این جایگاه به جمینای 3 تعلق گرفت.

رتبه اول جمینای 3 در بنچمارک lmarena

یکی از شاخص‌ترین عملکردهای Gemini 3، کسب امتیاز ۳۷.۴ در بنچمارک Humanity’s Last Exam است که برای اندازه‌گیری استدلال کلی و تخصصی طراحی شده و رکورد جدیدی در این شاخص به‌حساب می‌آید. مدل GPT 5 Pro با امتیاز ۳۱.۶۴ تاکنون رکورددار این بنچمارک بود.

گوگل علاوه‌بر نسخه‌ی استاندارد، نسخه‌ای تخصصی‌تر با عنوان deep thinking و فیچر «Gemini Agent» را نیز برای جمینای 3 پرو معرفی کرده است که برای مشترکان Ultra در هفته‌های آینده و پس از انجام آزمون‌های ایمنی در دسترس قرار خواهد گرفت.

جالت Thinking در جمینای 3 پرو
حالت Thinking در جمینای 3 پرو

گوگل توضیح می‌دهد که جمینای 3 می‌تواند با قابلیت ترکیب اطلاعات از متن، تصویر، ویدیو و کد از طریق یک پنجره‌ی یک میلیون توکنی، داده‌های پیچیده را تحلیل و خروجی‌های عمیق‌تر و حرفه‌ای‌تری تولید کند. برای مثال، گوگل خاطرنشان می‌کند که جمینای 3 می‌تواند عکس یک دستور پخت را ترجمه و سپس آن را به یک کتاب آشپزی تبدیل کند یا از مجموعه‌ای از ویدیوها کارت‌های فلش آموزشی تولید نماید.

Gemini 3 Pro توانست در آزمون‌های MMMU-Pro و Video-MMMU امتیازهای ۸۱ و ۸۷.۶ درصدی را کسب کند که نشان می‌دهد که این مدل در پردازش چندوجهی عملکردی فوق‌العاده دارد. برتری جمینای 3 پرو در آزمون SWE-bench Verified (بنچمارک تخصصی گیت‌هاب برای سنجش توانایی مدل‌ها در رفع باگ‌های نرم‌افزاری) با کسب امتیاز 76 درصد، مهارت کدنویسی مدل پرچمدار گوگل را نشان می‌دهد.

نمودار مقایسه امتیاز جمینای 3 پرو با مدل‌های دیگر در بنچمارک‌های متعدد

گوگل در بیانیه‌ی خود همچنین اشاره کرده است که مدل جدید «کمی کمتر تملق‌گو» خواهد بود؛ به این معنا که پاسخ‌های جمینای 3 به‌گونه‌ای طراحی شده‌اند که «هوشمند، کوتاه و مستقیم» باشند و به‌جای آنکه صرفا آنچه کاربر دوست دارد بشنود را بگویند، «آنچه لازم است بشنود» را ارائه می‌دهند.

غول دنیای جستجو اپلیکیشنی دیگر با نام Google Antigravity را به‌عنوان دستیار کدنویسی معرفی کرده است که ترکیبی از محیط چت‌بات، رابط خط فرمان و مرورگر در یک ابزار مبتنی‌بر هوش مصنوعی محسوب می‌شود. این ابزار به توسعه‌دهندگان امکان می‌دهد تا در محیطی چندبخشی و پویا، با کدنویس هوشمند همکاری کنند و تغییرات کد را مستقیم در مرورگر مشاهده نمایند.

مقایسه امتیاز جمینای 3 پرو با مدل‌های دیگر در بنچمارک‌های متعدد
مقایسه امتیاز جمینای 3 پرو با مدل‌های دیگر در بنچمارک‌های متعدد

گوگل اعلام کرده است که اپلیکیشن Gemini هم‌اکنون بیش از ۶۵۰ میلیون کاربر فعال ماهانه دارد و ۱۳ میلیون توسعه‌دهنده‌ی نرم‌افزار از این مدل به‌عنوان بخشی از فرایند کاری‌شان استفاده کرده‌اند.

گوگل همزمان با معرفی جمینای 3، قابلیت جدیدی موسوم‌به Generative UI را رونمایی کرد. این ویژگی اکنون در نسخه‌ی محدود و آزمایشی اپلیکیشن Gemini از طریق حالت Dynamic View و همچنین در حالت AI Mode جست‌وجوی گوگل در دسترس است.

سازوکار Generative UI به‌گونه‌ای طراحی شده است که مدل هوش مصنوعی جمینای 3 پس از تحلیل پرامپت کاربر، در صورتی که توضیح نوشتاری یا تصویری کافی نباشد، اقدام به تولید یک رابط کاربری پویا می‌کند. این رابط به‌صورت مستقیم در صفحه‌ی نتایج ظاهر می‌شود و کاربر می‌تواند با اسلایدرها، ورودی‌ها و سایر اجزای تعاملی، داده‌ها را تغییر دهد و بلافاصله نتایج را مشاهده کند.

گوگل در بخش دیگری از برنامه‌های هوش مصنوعی خود، اقدام به افزودن قابلیت‌های تازه به نسخه سازمانی جمینای برای کسب‌وکارها پرداخته است.