چینی‌ها دوباره مدل جدیدی معرفی کرده‌اند که با مدل‌های برتر مثل ChatGPT-o1 mini رقابت می‌کند! شرکت علی‌بابا به‌تازگی مدل هوش مصنوعی QwQ-32B (مخفف Qwen with Questions) را معرفی کرده است؛ یک مدل استدلالی زبان بزرگ (LRM) که بسیار پیشرفته و قدرتمند است.

شرکت علی‌بابا اولین نسخه هوش مصنوعی Qwen را چند ماه پیش عرضه کرده بود؛ اما نسخه جدید علاوه بر عملکرد بهتر در بنچمارک‌ها، از نظر مصرف حافظه و پردازش نیز بهینه‌تر است.

هوش مصنوعی QwQ-32B چیست؟

هوش مصنوعی QwQ-32B یک مدل استدلالی است؛ به این معنی که برای انجام بهتر وظایفی مانند حل مسائل ریاضی و کدنویسی (که نیاز به تفکر گام‌به‌گام و حل مسئله دارند) آموزش دیده است. به نقل از venturebeat، این مدل دارای ۳۲ میلیارد پارامتر است که به‌طور قابل‌توجهی کوچک‌تر از نسخه اصلی DeepSeek-R1 با ۶۷۱ میلیارد پارامتر محسوب می‌شود.

مدل QwQ-32B در آزمون‌های ریاضی و کدنویسی، عملکردی نزدیک به DeepSeek-R1-671B دارد و از o1-mini هم بهتر عمل می‌کند.

البته همچنان از مدل‌های o1، o3-mini، Claude 3.7 Sonnet و Grok-3 ضعیف‌تر است.

عملکرد هوش مصنوعی QwQ-32B و فرآیند آموزش آن

مدل QwQ-32B بر پایه Qwen-2.5-32B، مدل زبانی عمومی پیشرفته تیم Qwen ساخته شده است. تیم توسعه‌دهنده از یادگیری تقویتی (RL) با پاداش مبتنی‌بر نتیجه استفاده کرده‌اند. به این معنا که مدل، به‌طور مستقل فرایند استدلال را انجام داده و نتیجه‌ای را تولید می‌کند. سپس این نتیجه توسط یک تأییدکننده مانند مفسر کد یا حل‌کننده ریاضی بررسی می‌شود و مدل پاسخ خود را اصلاح کرده تا به پاسخ صحیح برسد.

طبق اعلام علی‌بابا، این مدل از قابلیت‌های مرتبط با عامل‌های هوشمند (Agent-related capabilities) نیز بهره می‌برد که به آن اجازه می‌دهد در حین استفاده از ابزارها، استدلال خود را با توجه به بازخورد محیطی تنظیم کند.

دسترسی به هوش مصنوعی QwQ-32B چگونه است؟

برخلاف OpenAI o1 و o3، مدل QwQ-32B متن‌باز است، به این معنا که می‌توانید آن را دانلود کرده و روی سرورهای خود اجرا کنید. این مدل در Hugging Face و ModelScope (معادل چینی Hugging Face) در دسترس است. همچنین تحت مجوز Apache 2.0 منتشر شده که استفاده تجاری از آن را امکان‌پذیر می‌کند.

البته، تیم Qwen کد منبع و داده‌های مورد استفاده برای آموزش مدل را منتشر نکرده‌اند، بنابراین نمی‌توان آن را یک مدل کاملاً متن‌باز دانست.


یک نسخه میزبانی‌شده از QwQ-32B در Hugging Face Spaces موجود است که در آن می‌توانید قابلیت‌های استدلالی مدل را آزمایش کنید. همچنین، این مدل از طریق Qwen Chat نیز قابل دسترسی است.
هنگام استفاده از مدل‌های چینی، مراقب باشید که اطلاعات حساس خود را وارد نکنید.