تب‌وتاب هوش مصنوعی از آمریکا با مدل‌هایی مثل Chatgpt شروع شد؛ اما شعله این هیجان با چینی‌ها و مدل‌هایی مثل هوش مصنوعی deepseek ادامه پیدا کرد! حالا یک شرکت هوش مصنوعی چینی دیگر مدل استدلالی قدرتمندی معرفی کرده که طبق معمول،‌ بسیار ارزان است.

شرکت چینی ByteDance، مالک تیک‌تاک، با معرفی جدیدترین مدل خود به نام هوش مصنوعی Seed-Thinking-v1.5 وارد میدان شده است. این مدل زبانی با هدف ارتقای توانایی استدلال در حوزه‌های علوم، فناوری، ریاضی و مهندسی (STEM) و نیز کاربردهای عمومی طراحی شده است.

این مدل هنوز برای استفاده عمومی در دسترس نیست و شرایط آن مشخص نیست که آیا متن‌باز، انحصاری یا حالتی میان این دو خواهد بود. با این حال، مقاله فنی منتشر شده در venturebeat شامل جزئیات قابل‌توجهی است که بررسی آن‌ها ارزشمند است.

هوش مصنوعی Seed-Thinking-v1.5 از چین

هرچه که درباره هوش مصنوعی Seed-Thinking-v1.5 باید بدانید

هوش مصنوعی Seed-Thinking-v1.5 نیز مانند Llama 4 شرکت Meta و Mixtral از شرکت Mistral، بر پایه معماری محبوب Mixture-of-Experts طراحی شده است. این ساختار به مدل‌ها امکان می‌دهد با استفاده هم‌زمان از فقط بخشی از کل پارامترها، کارآمدتر عمل کنند. در این مدل، تنها ۲۰ میلیارد از مجموع ۲۰۰ میلیارد پارامتر در هر زمان فعال هستند.

هوش مصنوعی Seed-Thinking-v1.5 تمرکز ویژه‌ای بر استدلال ساختاریافته و تولید پاسخ‌های سنجیده دارد.

این مدل عملکردی بهتر از DeepSeek R1 داشته و به عملکرد مدل‌های پیشرفته‌ای چون هوش مصنوعی Gemini 2.5 Pro گوگل و o3-mini-high OpenAI نزدیک شده است. در برخی ارزیابی‌ها مانند ARC-AGI (معیاری برای سنجش نزدیکی به هوش مصنوعی انسان‌گونه)، حتی از این دو نیز بهتر عمل کرده است.

جایگاهی میان‌رده اما قدرتمند

مدل Seed-Thinking-v1.5 به‌عنوان گزینه‌ای جمع‌وجور ولی توانمند در کنار مدل‌های پیشرفته‌تر مطرح شده و نتایج رقابتی قابل توجهی در بنچمارک‌ها به‌دست آورده است. این مدل در فرایند آموزش خود از نوآوری‌هایی در یادگیری تقویتی (RL)، انتخاب دقیق داده‌های آموزشی و زیرساخت‌های هوش مصنوعی بهره برده است.

ارزیابی‌های انسانی و کاربرد واقعی

شرکت ByteDance (سازنده این مدل) آزمایش‌هایی در حوزه‌هایی مانند نویسندگی خلاق، دانش علوم انسانی و مکالمات عمومی انجام داده تا بفهمد این مدل چقدر به ترجیحات و سلایق یک انسان نزدیک است. مدل Seed-Thinking-v1.5 در تمام آزمون‌ها عملکردی بهتر از DeepSeek R1 داشت و نشان داد که برای نیازهای واقعی کاربران نیز کاربردی است.

نظر شما درباره این مدل چیست و به نظرتان آیا مدل‌های هوش مصنوعی چینی بهتر هستند؟