به نظر می‌رسد استارتاپ چینی DeepSeek قصد دارد همین روزها مدل جدیدی را وارد بازار کند، مدلی که با نام «DeepSeek R2» شناخته خواهد شد. مدل هوش مصنوعی DeepSeek R2 می‌تواند درست مثل مدل قبلی هوش مصنوعی DeepSeek بار دیگر بازار هوش مصنوعی را متحول کند.

اولین مدل DeepSeek توانست به جهان ثابت کند که چین در توسعه مدل‌های هوش مصنوعی اصلا عقب نیست؛ حالا چینی‌ها تصمیم دارند با مدل R2 جهان را دوباره با یک سورپرایز جدید شوکه شوند.

مدل جدید هوش مصنوعی deepseek

به نقل از wccftech، رسانه‌های چینی مدعی هستند که مدل DeepSeek R2 از معماری Mixture of Experts (MoE) استفاده کرده؛ که نسخه‌ پیشرفته‌تری از معماری‌های موجود به حساب می‌آید. گفته می‌شود با این معماری، هوش مصنوعی DeepSeek R2 به اندازه دو برابر مدل قبلی پارامتر خواهد داشت و به ۱.۲ تریلیون پارامتر می‌رسد. همین موضوع به‌تنهایی نشان‌دهنده این است که R2 می‌تواند با GPT-4 Turbo و Gemini 2.0 Pro گوگل رقابت کند.

همچنین گزارش‌های دیگر نشان می‌دهد که هزینه محاسباتی هر توکن مدل جدید هوش مصنوعی deepseek نسبت به مدل chatgpt-4 بسیار بسیار کمتر خواهد بود؛‌ تقریبا ۹۷٪ کمتر!

به‌این‌ترتیب مدل R2 به‌صرفه‌ترین مدل موجود جهان خواهد شد و این عرضه ممکن است نقطه عطفی در اقتصاد هوش مصنوعی باشد.

البته یک بار دیگر باید یادآوری کرد که این اطلاعات درباره مدل DeepSeek R2 در حد شایعه هستند و ممکن است مدل نهایی تفاوت‌هایی داشته باشد.

در دیگر خبرهای مربوط به هوش مصنوعی چینی‌ها هم دیدیم که شرکت چینی Baidu از دو مدل‌ قدرتمند و ارزان جدیدش رونمایی کرده است.