به نظر میرسد استارتاپ چینی DeepSeek قصد دارد همین روزها مدل جدیدی را وارد بازار کند، مدلی که با نام «DeepSeek R2» شناخته خواهد شد. مدل هوش مصنوعی DeepSeek R2 میتواند درست مثل مدل قبلی هوش مصنوعی DeepSeek بار دیگر بازار هوش مصنوعی را متحول کند.
اولین مدل DeepSeek توانست به جهان ثابت کند که چین در توسعه مدلهای هوش مصنوعی اصلا عقب نیست؛ حالا چینیها تصمیم دارند با مدل R2 جهان را دوباره با یک سورپرایز جدید شوکه شوند.

به نقل از wccftech، رسانههای چینی مدعی هستند که مدل DeepSeek R2 از معماری Mixture of Experts (MoE) استفاده کرده؛ که نسخه پیشرفتهتری از معماریهای موجود به حساب میآید. گفته میشود با این معماری، هوش مصنوعی DeepSeek R2 به اندازه دو برابر مدل قبلی پارامتر خواهد داشت و به ۱.۲ تریلیون پارامتر میرسد. همین موضوع بهتنهایی نشاندهنده این است که R2 میتواند با GPT-4 Turbo و Gemini 2.0 Pro گوگل رقابت کند.
همچنین گزارشهای دیگر نشان میدهد که هزینه محاسباتی هر توکن مدل جدید هوش مصنوعی deepseek نسبت به مدل chatgpt-4 بسیار بسیار کمتر خواهد بود؛ تقریبا ۹۷٪ کمتر!
بهاینترتیب مدل R2 بهصرفهترین مدل موجود جهان خواهد شد و این عرضه ممکن است نقطه عطفی در اقتصاد هوش مصنوعی باشد.
البته یک بار دیگر باید یادآوری کرد که این اطلاعات درباره مدل DeepSeek R2 در حد شایعه هستند و ممکن است مدل نهایی تفاوتهایی داشته باشد.
در دیگر خبرهای مربوط به هوش مصنوعی چینیها هم دیدیم که شرکت چینی Baidu از دو مدل قدرتمند و ارزان جدیدش رونمایی کرده است.