شرکت بزرگ OpenAI که چند روز پیش مدل قدرتمند و استدلالی هوش مصنوعی ChatGPT-4.1 را معرفی کرده بود؛ بلافاصله از جدیدترین مدل خود به نام هوش مصنوعی o3 و یک مدل مینی دیگر رونمایی کرد. در این خبر نامبرلند درباره این مدل‌ها می‌خوانیم.

مدل هوش مصنوعی o3 و قابلیت تفکر با تصویر

هوش مصنوعی o3 قادر به تفکر است یعنی پیش از این‌که پاسخ دهد، مکث می‌کند و سپس پاسخ را تولید می‌کند؛‌ اما فقط این نیست! OpenAI می‌گوید مدل o3 قادر است «تفکر با تصویر» هم داشته باشد! به این معنا که شما (به‌عنوان کاربر) تصویری را آپلود می‌کنید و مدل این تصویر را به خوبی درک می‌کند. سپس باهم درباره این تصویر گفت‌وگو می‌کنید و مدل با تحلیل تصویر، به سوالات شما پاسخ خواهد داد.

این مدل‌ها همچنین می‌توانند تصویر را بچرخانند، بزرگ‌نمایی (زوم) کنند و از دیگر ابزارهای ویرایش تصویر بهره بگیرند که قابلیتی ویژه است.

مدل هوش مصنوعی o3 مدل اصلی استدلالی OpenAI است اما هم‌زمان مدل کوچک‌تری به نام o4-mini نیز عرضه شده است. تمرکز این مدل‌ها حل مسائل پیچیده و تفکر گام‌به‌گام برای رسیدن به پاسخ است.

هوش مصنوعی o3 جدیدترین و پیشرفته‌ترین مدل استدلال‌گر این شرکت تا به این لحظه است که در آزمون‌های مختلف برنامه‌نویسی، ریاضیات، استدلال و درک بصری از همه مدل‌های قبلی جلوتر است. OpenAI می‌گوید مدل o3 با این توانایی‌ها می‌تواند گام‌هایی در جهت خودمختاری بردارد!

به گفته openai، هر دو مدل هوش مصنوعی o3 و مدل o4-mini ابزارهای چت جی‌پی‌تی مثل تولید تصویر و پردازش آن،‌ اجرای کد پایتون یا جست‌وجوی وب را در اختیار دارند.

مدل o3 و مدل o4-mini درحال‌حاضر برای کاربران ChatGPT Plus، Pro و Team در دسترس قرار دارند.

رقابتی سخت و فشرده

OpenAI از زمان معرفی چت‌بات پرطرفدار ChatGPT در اواخر سال ۲۰۲۲ تاکنون مدل‌های جدید و پیشرفته‌ زیادی معرفی کرده و همچنین مدل‌های قبلی را مدام ارتقا داده است. رقابت در عرصه مدل‌های هوش مصنوعی بسیار سخت است؛ چراکه رقیبان قدرتمندی مثل گوگل، آنتروپیک و حتی شرکت‌های چینی مثل deepseek در این عرصه حضور دارند و هرکدام برای پیشتازی تلاش می‌کنند.

به‌طور مثال هوش مصنوعی ایلان ماسک دیروز از قابلیت Grok Studio رونمایی کرد یا شرکت anthropic درحال عرضه آپدیت‌های ویژه برای هوش مصنوعی Claude است تا به‌هیچ‌عنوان موقعیت فعلی خود را در این عرصه از دست ندهند.

در همین رقابت فشرده، مدل‌های Grok 3 از شرکت xAI (متعلق به ایلان ماسک) هم حرف‌های زیادی برای گفتن دارند. این مدل‌ها نه‌تنها قابلیت تحلیل تصویری و پاسخ‌گویی استدلالی دارند، بلکه با معرفی ویژگی‌هایی مانند DeepSearch و حالت Big Brain به‌طور جدی وارد رقابت با مدل‌هایی مثل o3 شده‌اند.
اگر می‌خواهید با معماری این مدل‌ها، قابلیت‌های فنی و نحوه عملکرد آن‌ها بیشتر آشنا شوید، مطالعه‌ی بلاگ «هوش مصنوعی گروک چیست» را توصیه می‌کنیم؛ در این بلاگ به‌طور جامع درباره چیستی مدل‌های Grok، نحوه راه‌اندازی، تفاوت نسخه‌های مختلف و برنامه زمانی عرضه آن‌ها توضیح داده شده است.

همچنین اگر قصد استفاده از این مدل‌ها را دارید، بخش خرید اکانت هوش مصنوعی Grok در همین صفحه راهنمای کاملی برای شماست. در این بخش، تفاوت نسخه‌های رایگان و پرمیوم Grok به‌صورت دقیق بررسی شده است و می‌توانید با مقایسه امکانات، اشتراک مناسب خود را انتخاب و تهیه کنید. نسخه پرمیوم با فعال‌سازی قابلیت‌هایی مانند DeepSearch، حالت Big Brain و دسترسی به مدل‌های پیشرفته‌تر، تجربه‌ای کامل‌تر از هوش مصنوعی Grok را برای کاربران فراهم می‌کند.