یک آزمایشگاه چینی، مدل جدیدی از هوش مصنوعی با نام DeepSeek-R1 را به جهان معرفی کرده که به نظر میرسد رقیبی برای مدل هوش مصنوعی o1 از شرکت OpenAI باشد. این مدل، که توسط شرکت تحقیقاتی DeepSeek توسعه یافته، آنها ادعا میکنند مدلشان «توانایی استدلال» دارد و خطاهای معمول دیگر مدلها را ندارد.
مدل DeepSeek-R1: مدلی که فکر میکند
مدلهای استدلالگر میتوانند پاسخهای خود را بررسی کنند؛ زیرا زمان بیشتری برای تحلیل پرامپتها صرف میکنند. همین صبر کردن و تحلیل، به مدل کمک میکند تا از خطاهایی که معمولاً مدلها به آن دچار میشوند، اجتناب کنند. دقیقا مشابه مدل o1 از OpenAI!
این فرایند ممکن است زمانبر باشد و بسته به پیچیدگی سؤال، مدل ممکن است دهها ثانیه برای ارائه پاسخ “فکر” کند.
عملکرد هوش مصنوعی DeepSeek-R1
به گفته سازندگان این مدل، که نسخه اولیه آن با نام DeepSeek-R1-Lite-Preview منتشر شده، هوش مصنوعی DeepSeek-R1 در دو معیار مهم هوش مصنوعی یعنی AIME و MATH عملکردی مشابه o1 دارد. با این حال، این مدل همانند o1 در برخی مسائل منطقی مانند دوزبازی ضعف نشان میدهد و به راحتی میتوان آن را گول زد.
همچنین مدل DeepSeek-R1 از پاسخ دادن به پرسشهایی که بیش از حد سیاسی تلقی میشوند، خودداری میکند. در آزمایشها، این مدل از پاسخ به سؤالات درباره رییس جمهور چین آقای شی جینپینگ، میدان تیانآنمن و پیامدهای ژئوپلیتیک حمله احتمالی چین به تایوان امتناع کرد.
این محدودیتها احتمالاً ناشی از فشار دولت چین بر پروژههای هوش مصنوعی در این کشور است. مدلهای هوش مصنوعی در چین شدیدا تحت نظر هستند که مبادا حرفی بزنند که باارزشهای کمونیستی و سوسیالیستی در تضاد باشد.
این مدل از پردازش زمان اجرا (test-time compute) بهره میبرد که به آن زمان بیشتری برای ارائه پاسخ دقیقتر میدهد. معرفی این مدل نشاندهنده حرکت جدید در حوزه هوش مصنوعی و تلاش برای یافتن رویکردهایی فراتر از قوانین سنتی مقیاسپذیری است. کمپانی DeepSeek قصد دارد این مدل را متنباز کرده و API آن را نیز منتشر کند.
چینیهای بهدردنخور