یک آزمایشگاه چینی، مدل جدیدی از هوش مصنوعی با نام DeepSeek-R1 را به جهان معرفی کرده که به نظر می‌رسد رقیبی برای مدل هوش مصنوعی o1 از شرکت OpenAI باشد. این مدل، که توسط شرکت تحقیقاتی DeepSeek توسعه یافته، آن‌ها ادعا میکنند مدلشان «توانایی استدلال» دارد و خطاهای معمول دیگر مدل‌ها را ندارد.

مدل DeepSeek-R1: مدلی که فکر می‌کند

مدل‌های استدلال‌گر می‌توانند پاسخ‌های خود را بررسی کنند؛ زیرا زمان بیشتری برای تحلیل پرامپت‌ها صرف می‌کنند. همین صبر کردن و تحلیل، به مدل کمک می‌کند تا از خطاهایی که معمولاً مدل‌ها به آن دچار می‌شوند، اجتناب کنند. دقیقا مشابه مدل o1 از OpenAI!

این فرایند ممکن است زمان‌بر باشد و بسته به پیچیدگی سؤال، مدل ممکن است ده‌ها ثانیه برای ارائه پاسخ “فکر” کند.

عملکرد هوش مصنوعی DeepSeek-R1

به گفته سازندگان این مدل، که نسخه اولیه آن با نام DeepSeek-R1-Lite-Preview منتشر شده، هوش مصنوعی DeepSeek-R1 در دو معیار مهم هوش مصنوعی یعنی AIME و MATH عملکردی مشابه o1 دارد. با این حال، این مدل همانند o1 در برخی مسائل منطقی مانند دوزبازی ضعف نشان می‌دهد و به راحتی می‌توان آن را گول زد.

همچنین مدل DeepSeek-R1 از پاسخ دادن به پرسش‌هایی که بیش از حد سیاسی تلقی می‌شوند، خودداری می‌کند. در آزمایش‌ها، این مدل از پاسخ به سؤالات درباره رییس جمهور چین آقای شی جین‌پینگ، میدان تیان‌آن‌من و پیامدهای ژئوپلیتیک حمله احتمالی چین به تایوان امتناع کرد.

این محدودیت‌ها احتمالاً ناشی از فشار دولت چین بر پروژه‌های هوش مصنوعی در این کشور است. مدل‌های هوش مصنوعی در چین شدیدا تحت نظر هستند که مبادا حرفی بزنند که باارزش‌های کمونیستی و سوسیالیستی در تضاد باشد.

این مدل از پردازش زمان اجرا (test-time compute) بهره می‌برد که به آن زمان بیشتری برای ارائه پاسخ دقیق‌تر می‌دهد. معرفی این مدل نشان‌دهنده حرکت جدید در حوزه هوش مصنوعی و تلاش برای یافتن رویکردهایی فراتر از قوانین سنتی مقیاس‌پذیری است. کمپانی DeepSeek قصد دارد این مدل را متن‌باز کرده و API آن را نیز منتشر کند.