شرکت علی‌بابا این روزها بسیار مشغول است؛ پس از انتشار مدل ویدیوساز هوش مصنوعی Wan 2.1، تیم علی‌بابا حالا از QwQ-Max-Preview با قابلیت‌های پیشرفته‌ی استدلال رونمایی کرده است.

مدل QwQ-Max-Preview جدید‌ترین مدل از سری Qwen علی‌بابا است که بر پایه Qwen2.5-Max ساخته شده، این مدل قابلیت‌های پیشرفته‌ای در زمینه‌ی استدلال، ریاضی، کدنویسی و وظایف عمومی، به همراه تمرکز بر گردش‌های کاری مرتبط با Agent دارد.

تیم علی‌بابا گفته است که مدل‌های QwQ-Max و Qwen2.5-Max قرار است به‌صورت متن‌باز منتشر شود؛‌ همچنین نسخه کوچک‌تر و سبک‌تری هم به نام QwQ-32B ساخته می‌شود که روی دستگاه‌هایی مثل گوشی و لپ‌تاپ اجرا شود.

به نظر می‌رسد چینی‌ها در علم و تکنولوژی توقف‌ناپذیر شده‌اند!‌ پس از موفقیت عجیب هوش مصنوعی deepseek که باعث انگشت‌به‌دهان ماندن غول‌های تکنولوژی جهان شد،‌ چینی‌ها از یک مدل جدید رونمایی کردند که مدعی است حتی از هوش مصنوعی deepseek هم بهتر است!

شرکت تکنولوژی علی‌بابا از مدل Qwen2.5-Max رونمایی کرده و مدعی است نه‌تنها از مدل‌های آمریکایی مثل GPT-4o، Claude-3.5-Sonnet یا Llama-3.1 بهتر است،‌ بلکه از آخرین مدل deepseek هم عملکرد بهتری دارد!

API این مدل هم‌اکنون در Alibaba Cloud برای دسترس توسعه‌دهندگان عرضه شده و برای کاربران هم در Qwen Chat در دسترس قرار دارد.

شرکت علی‌بابا بر بهره‌وری بالا تأکید دارد. مدل جدیدشان بر روی بیش از ۲۰ تریلیون توکن آموزش دیده؛ اما به دلیل استفاده از معماری Mixture-of-Experts (MoE) به منابع محاسباتی بسیار کمتری نسبت به روش‌های سنتی نیاز دارد.

رونمایی از این مدل در حالی صورت می‌گیرد که اخیرا هوش مصنوعی DeepSeek کل جهان را تحت‌تاثیر خود قرار داده است و حتی به‌ علت هجوم شدید کاربران، چندین بار از دسترس خارج شد.

ظهور مدل‌های هوش مصنوعی کم‌هزینه چینی، به سقوط یک تریلیون دلاری ارزش سهام شرکت‌های فناوری آمریکایی، به‌ویژه انویدیا، منجر شده است. باید دید که آیا این مدل‌ها در بلندمدت هم کارکرد خوبی نشان می‌دهند یا نه.

نظر شما چیست؟