تبوتاب هوش مصنوعی از آمریکا با مدلهایی مثل Chatgpt شروع شد؛ اما شعله این هیجان با چینیها و مدلهایی مثل هوش مصنوعی deepseek ادامه پیدا کرد! حالا یک شرکت هوش مصنوعی چینی دیگر مدل استدلالی قدرتمندی معرفی کرده که طبق معمول، بسیار ارزان است.
شرکت چینی ByteDance، مالک تیکتاک، با معرفی جدیدترین مدل خود به نام هوش مصنوعی Seed-Thinking-v1.5 وارد میدان شده است. این مدل زبانی با هدف ارتقای توانایی استدلال در حوزههای علوم، فناوری، ریاضی و مهندسی (STEM) و نیز کاربردهای عمومی طراحی شده است.
این مدل هنوز برای استفاده عمومی در دسترس نیست و شرایط آن مشخص نیست که آیا متنباز، انحصاری یا حالتی میان این دو خواهد بود. با این حال، مقاله فنی منتشر شده در venturebeat شامل جزئیات قابلتوجهی است که بررسی آنها ارزشمند است.

هرچه که درباره هوش مصنوعی Seed-Thinking-v1.5 باید بدانید
هوش مصنوعی Seed-Thinking-v1.5 نیز مانند Llama 4 شرکت Meta و Mixtral از شرکت Mistral، بر پایه معماری محبوب Mixture-of-Experts طراحی شده است. این ساختار به مدلها امکان میدهد با استفاده همزمان از فقط بخشی از کل پارامترها، کارآمدتر عمل کنند. در این مدل، تنها ۲۰ میلیارد از مجموع ۲۰۰ میلیارد پارامتر در هر زمان فعال هستند.
هوش مصنوعی Seed-Thinking-v1.5 تمرکز ویژهای بر استدلال ساختاریافته و تولید پاسخهای سنجیده دارد.
این مدل عملکردی بهتر از DeepSeek R1 داشته و به عملکرد مدلهای پیشرفتهای چون هوش مصنوعی Gemini 2.5 Pro گوگل و o3-mini-high OpenAI نزدیک شده است. در برخی ارزیابیها مانند ARC-AGI (معیاری برای سنجش نزدیکی به هوش مصنوعی انسانگونه)، حتی از این دو نیز بهتر عمل کرده است.
جایگاهی میانرده اما قدرتمند
مدل Seed-Thinking-v1.5 بهعنوان گزینهای جمعوجور ولی توانمند در کنار مدلهای پیشرفتهتر مطرح شده و نتایج رقابتی قابل توجهی در بنچمارکها بهدست آورده است. این مدل در فرایند آموزش خود از نوآوریهایی در یادگیری تقویتی (RL)، انتخاب دقیق دادههای آموزشی و زیرساختهای هوش مصنوعی بهره برده است.
ارزیابیهای انسانی و کاربرد واقعی
شرکت ByteDance (سازنده این مدل) آزمایشهایی در حوزههایی مانند نویسندگی خلاق، دانش علوم انسانی و مکالمات عمومی انجام داده تا بفهمد این مدل چقدر به ترجیحات و سلایق یک انسان نزدیک است. مدل Seed-Thinking-v1.5 در تمام آزمونها عملکردی بهتر از DeepSeek R1 داشت و نشان داد که برای نیازهای واقعی کاربران نیز کاربردی است.
نظر شما درباره این مدل چیست و به نظرتان آیا مدلهای هوش مصنوعی چینی بهتر هستند؟