ایلان ماسک همیشه پرحاشیه و جنجالی است! او یکی دو هفته گذشته را به تبلیغات برای جدیدترین مدل هوش مصنوعی شرکتش، یعنی هوش مصنوعی Grok-3 مشغول بود و حتی چندباری گفته بود گراک سه «بهترین هوش مصنوعی جهان» است! اکنون بحثوجدالهایی درباره راستی و درستی این ادعا مطرح شده است.
جنجالها پیرامون هوش مصنوعی Grok-3
به گزارش techcrunch، یکی از کارمندان OpenAI شرکت xAI را به ارائه نتایج گمراهکننده درباره هوش مصنوعی گراک ۳ متهم کرده است. این جنجال از گرافی شروع شد که xAI منتشر کرده بود و در آن عملکرد Grok 3 در AIME 2025 (معیاری برای سنجش مسائل ریاضی پیچیده) را بسیار بالا نشان داده شده بود. در این گراف مدلهای Grok 3 Reasoning Beta و Grok 3 mini Reasoning عملکرد بهتری نسبت به مدل o3-mini-high دارند.
جنجال اصلی این است که چرا شرکت xAI به این حقیقت اشاره نکرده که این نتایج در حالت cons@64 گرفته شدهاند.
حالت consensus@64 به مدل این امکان را میدهد که هر سوال را 64 بار امتحان کند و پاسخ پرتکرار را بهعنوان پاسخ نهایی انتخاب کند. از آنجاکه این حالت بهطور قابلتوجهی نمرات مدل را بهبود میبخشد، حذف آن از مقایسه xAI باعث شد Grok 3 پیشرفتهتر از آنچه که واقعاً هست، به نظر برسد.
از طرف دیگر شرکت xAI از رویکرد خود دفاع کرده و میگوید OpenAI نیز معیارهای انتخابی خود را ارائه داده است.
این حقیقتی است که هر شرکتی برای خودش معیارهای خاص خودش را نشان میدهد و به روش خودش سعی دارد برتری خود را اثبات کند. ما هنوز معیارهای استاندارد، شفاف و درستی برای سنجش مدلها و بررسی بهصرفهبودن هزینهای که برایشان شده نداریم.