خبر تکمیلی:‌ به‌نظر می‌رسد شرکت DeepSeek دامنه ai.com‎ را خریده، چراکه اکنون با کلیک روی آن مستقیم به صفحه ثبت‌نام هوش مصنوعی deepseek ری‌دایرکت می‌شوید. دقیقا مثل کاری که OpenAI با خرید chat.com‎ انجام داد.

مشخص است که خرید دامنه‌های رُند و جالب تبدیل به یک مسابقه بین شرکت‌های مطرح در دنیای هوش مصنوعی شده است!

هوش مصنوعی Deepseek محصول چینی‌ها، به‌تازگی از جدیدترین مدل خود یعنی مدل مدل R1 رونمایی کرد. مدل Deepseek R1 یک مدل استدلال‌گر رایگان و اوپن‌سورس (منبع باز یا همان Open source) است که طبق ادعای خودشان حتی از مدل o1-mini هم عملکرد بهتری دارد.

چینی‌ها ادعا می‌کنند مدل Deep seek R1 بهترین مدل دنیا برای کدنویسی است!

چند روز پیش هم اپلیکیشن اندرویدی هوش مصنوعی Deep Seek منتشر شد و به گفته کاربران، یک جایگزین رایگان و حرفه‌ای برای چت جی‌پی‌تی ۴ و حتی نسخه o1 است! شما با اکانت جیمیل هم می‌توانید به‌راحتی وارد شوید و از آن استفاده کنید.

شما می‌توانید اپلیکیشن هوش مصنوعی deep seek را به رایگان دانلود کنید، فقط کافی است روی این لینک بزنید.

حریم خصوصی بسیار ضعیف مدل چینی deep seek

نکته مهم درباره شرکت Deepseek این است که همه داده‌های کاربران را ذخیره می‌کند، چه زمانی که با این چت‌بات کار کنید و چه زمانی که از API آن استفاده کنید، همه داده‌های شما در دسترس این شرکت قرار می‌گیرد. به همین علت توصیه می‌شود برای کارهای حساس و خاص از آن استفاده نکنید.

Deepseek V3 فکر می‌کند که چت جی‌پی‌تی است
Deepseek V3 فکر می‌کند که چت جی‌پی‌تی است

یک آزمایشگاه چینی، مدل جدیدی از هوش مصنوعی را با نام DeepSeek-R1 به جهان معرفی کرده که به نظر می‌رسد رقیبی برای مدل هوش مصنوعی o1 از شرکت OpenAI باشد. شرکت تحقیقاتی DeepSeek که این مدل را توسعه داده، ادعا می‌کند مدلشان «توانایی استدلال» دارد و خطاهای معمول دیگر مدل‌ها را ندارد.

مدل DeepSeek-R1: مدلی که فکر می‌کند

مدل‌های استدلال‌گر می‌توانند پاسخ‌های خود را بررسی کنند؛ زیرا زمان بیشتری برای تحلیل پرامپت‌ها صرف می‌کنند. همین صبر کردن و تحلیل، به مدل کمک می‌کند تا از خطاهایی که معمولاً مدل‌ها به آن دچار می‌شوند، اجتناب کنند. دقیقا مشابه مدل o1 از OpenAI!

این فرایند ممکن است زمان‌بر باشد و بسته به پیچیدگی سؤال، مدل ممکن است ده‌ها ثانیه برای ارائه پاسخ «فکر» کند.

عملکرد هوش مصنوعی DeepSeek

به گفته سازندگان این مدل که نسخه اولیه آن با نام DeepSeek-R1-Lite-Preview منتشر شده، هوش مصنوعی DeepSeek-R1 در دو معیار مهم هوش مصنوعی یعنی AIME و MATH عملکردی مشابه o1 دارد. با این حال، این مدل همانند o1 در برخی مسائل منطقی مانند دوزبازی ضعف نشان می‌دهد و به‌راحتی می‌توان آن را گول زد.

همچنین مدل DeepSeek-R1 از پاسخ دادن به پرسش‌هایی که بیش‌ازحد سیاسی تلقی می‌شوند، خودداری می‌کند. در آزمایش‌ها، این مدل از پاسخ به سؤالات درباره رییس جمهور چین آقای شی جین‌پینگ، میدان تیان‌آن‌من و پیامدهای ژئوپلیتیک حمله احتمالی چین به تایوان امتناع کرد.

این محدودیت‌ها احتمالاً ناشی از فشار دولت چین بر پروژه‌های هوش مصنوعی در این کشور است. مدل‌های هوش مصنوعی در چین شدیدا تحت نظر هستند که مبادا حرفی بزنند که با ارزش‌های کمونیستی و سوسیالیستی در تضاد باشد.

این مدل از پردازش زمان اجرا (test-time compute) بهره می‌برد که به آن زمان بیشتری برای ارائه پاسخ دقیق‌تر می‌دهد. معرفی این مدل نشان‌دهنده حرکت جدید در حوزه هوش مصنوعی و تلاش برای یافتن رویکردهایی فراتر از قوانین سنتی مقیاس‌پذیری است. کمپانی DeepSeek قصد دارد این مدل را متن‌باز و API آن را نیز منتشر کند.
جالب اینکه این هوش مصنوعی چینی‌، فکر می‌کند که چت جی‌پی‌تی است!

مدلی که فکر می‌کند چت جی‌پی‌تی است، در حقیقت نسخه جدید هوش مصنوعی شرکت Deepseek به نام Deepseek V3 است. چینی‌ها به‌تازگی این مدل را منبع باز کرده‌اند و تبلیغات فراوانی برایش انجام داده‌اند؛ مبنی‌بر اینکه «این مدل قوی‌ترین و بزرگ‌ترین مدل هوش مصنوعی منبع باز (open-source) در جهان است».

هرچند این مدل توانسته از آزمایش‌ها سربلند بیرون بیاید؛ به گزارش techcrunch، وقتی از او می‌پرسند که «تو چی هستی؟» خودش را به‌عنوان ChatGPT معرفی می‌کند.

وقتی از این مدل چینی خواسته شد تا بیشتر توضیح دهد، DeepSeek V3 اصرار می‌کند که نسخه‌ای از مدل GPT-4 OpenAI است که در سال 2023 منتشر شده است.

این موضوع در حال حاضر هم‌چنان به همین شکل ادامه دارد.

چرا Deepseek V3 فکر می‌کند که چت جی‌پی‌تی است؟

آقای کوک،‌ یکی از پژوهشگران هوش مصنوعی در کالج کینگ لندن، درمورد این اتفاق این‌طور توضیح داد: «ممکن است این اتفاق تصادفی باشد؛ اما متأسفانه، ما مواردی را دیده‌ایم که رقیبان به‌طور مستقیم مدل‌های خود را براساس خروجی‌های دیگر مدل‌ها آموزش می‌دهند تا از دانش آن‌ها استفاده کنند.»

کوک اشاره کرد که این روش آموزش مدل‌ها می‌تواند کیفیت مدل خودشان را «بسیار پایین بیاورد»؛ چراکه منجر به پاسخ‌های اشتباه و بی‌معنا می‌شود.

به عبارت دیگر، مدل نمی‌تواند به خودش اعتماد کند و خودش را شناسایی کند؛ اما نگرانی اصلی این است که DeepSeek V3، با استفاده بی‌چون‌وچرا از خروجی‌های GPT-4، همه اشتباهات این مدل را هم یاد می‌گیرد و هرگز پیشرفتی نمی‌کند.