ایلان ماسک همیشه پرحاشیه و جنجالی است! او یکی دو هفته گذشته را به تبلیغات برای جدیدترین مدل هوش مصنوعی شرکتش، یعنی هوش مصنوعی Grok-3 مشغول بود و حتی چندباری گفته بود گراک سه «بهترین هوش مصنوعی جهان» است! اکنون بحث‌وجدال‌هایی درباره راستی و درستی این ادعا مطرح شده است.

جنجال‌ها پیرامون هوش مصنوعی Grok-3

به گزارش techcrunch،‌ یکی از کارمندان OpenAI شرکت xAI را به ارائه نتایج گمراه‌کننده درباره هوش مصنوعی گراک ۳ متهم کرده است. این جنجال از گرافی شروع شد که xAI منتشر کرده بود و در آن عملکرد Grok 3 در AIME 2025 (معیاری برای سنجش مسائل ریاضی پیچیده) را بسیار بالا نشان داده شده بود. در این گراف مدل‌های Grok 3 Reasoning Beta و Grok 3 mini Reasoning عملکرد بهتری نسبت به مدل o3-mini-high دارند.

جنجال اصلی این است که چرا شرکت xAI به این حقیقت اشاره نکرده که این نتایج در حالت cons@64 گرفته‌ شده‌اند.

حالت consensus@64 به مدل این امکان را می‌دهد که هر سوال را 64 بار امتحان کند و پاسخ پرتکرار را به‌عنوان پاسخ نهایی انتخاب کند. از آنجاکه این حالت به‌طور قابل‌توجهی نمرات مدل را بهبود می‌بخشد، حذف آن از مقایسه xAI باعث شد Grok 3 پیشرفته‌تر از آنچه که واقعاً هست، به نظر برسد.

از طرف دیگر شرکت xAI از رویکرد خود دفاع کرده و می‌گوید OpenAI نیز معیارهای انتخابی خود را ارائه داده است.

این حقیقتی است که هر شرکتی برای خودش معیارهای خاص خودش را نشان می‌دهد و به روش خودش سعی دارد برتری خود را اثبات کند. ما هنوز معیارهای استاندارد، شفاف و درستی برای سنجش مدل‌ها و بررسی به‌صرفه‌بودن هزینه‌ای که برایشان شده نداریم.