چینیها دوباره مدل جدیدی معرفی کردهاند که با مدلهای برتر مثل ChatGPT-o1 mini رقابت میکند! شرکت علیبابا بهتازگی مدل هوش مصنوعی QwQ-32B (مخفف Qwen with Questions) را معرفی کرده است؛ یک مدل استدلالی زبان بزرگ (LRM) که بسیار پیشرفته و قدرتمند است.
شرکت علیبابا اولین نسخه هوش مصنوعی Qwen را چند ماه پیش عرضه کرده بود؛ اما نسخه جدید علاوه بر عملکرد بهتر در بنچمارکها، از نظر مصرف حافظه و پردازش نیز بهینهتر است.
هوش مصنوعی QwQ-32B چیست؟
هوش مصنوعی QwQ-32B یک مدل استدلالی است؛ به این معنی که برای انجام بهتر وظایفی مانند حل مسائل ریاضی و کدنویسی (که نیاز به تفکر گامبهگام و حل مسئله دارند) آموزش دیده است. به نقل از venturebeat، این مدل دارای ۳۲ میلیارد پارامتر است که بهطور قابلتوجهی کوچکتر از نسخه اصلی DeepSeek-R1 با ۶۷۱ میلیارد پارامتر محسوب میشود.
مدل QwQ-32B در آزمونهای ریاضی و کدنویسی، عملکردی نزدیک به DeepSeek-R1-671B دارد و از o1-mini هم بهتر عمل میکند.
البته همچنان از مدلهای o1، o3-mini، Claude 3.7 Sonnet و Grok-3 ضعیفتر است.
عملکرد هوش مصنوعی QwQ-32B و فرآیند آموزش آن
مدل QwQ-32B بر پایه Qwen-2.5-32B، مدل زبانی عمومی پیشرفته تیم Qwen ساخته شده است. تیم توسعهدهنده از یادگیری تقویتی (RL) با پاداش مبتنیبر نتیجه استفاده کردهاند. به این معنا که مدل، بهطور مستقل فرایند استدلال را انجام داده و نتیجهای را تولید میکند. سپس این نتیجه توسط یک تأییدکننده مانند مفسر کد یا حلکننده ریاضی بررسی میشود و مدل پاسخ خود را اصلاح کرده تا به پاسخ صحیح برسد.
طبق اعلام علیبابا، این مدل از قابلیتهای مرتبط با عاملهای هوشمند (Agent-related capabilities) نیز بهره میبرد که به آن اجازه میدهد در حین استفاده از ابزارها، استدلال خود را با توجه به بازخورد محیطی تنظیم کند.
دسترسی به هوش مصنوعی QwQ-32B چگونه است؟
برخلاف OpenAI o1 و o3، مدل QwQ-32B متنباز است، به این معنا که میتوانید آن را دانلود کرده و روی سرورهای خود اجرا کنید. این مدل در Hugging Face و ModelScope (معادل چینی Hugging Face) در دسترس است. همچنین تحت مجوز Apache 2.0 منتشر شده که استفاده تجاری از آن را امکانپذیر میکند.
البته، تیم Qwen کد منبع و دادههای مورد استفاده برای آموزش مدل را منتشر نکردهاند، بنابراین نمیتوان آن را یک مدل کاملاً متنباز دانست.
یک نسخه میزبانیشده از QwQ-32B در Hugging Face Spaces موجود است که در آن میتوانید قابلیتهای استدلالی مدل را آزمایش کنید. همچنین، این مدل از طریق Qwen Chat نیز قابل دسترسی است.
هنگام استفاده از مدلهای چینی، مراقب باشید که اطلاعات حساس خود را وارد نکنید.