حاشیه‌ها پیرامون هوش مصنوعی چینی deepseek زیاد بود، به‌ویژه که OpenAI اعلام کرده بود درحال بررسی احتمال نقض مالکیت و سرقت داده‌ها است. حالا مطالعه جدیدی که در ژورنال Forbes منتشر شده نشان می‌دهد مدل DeepSeek R1 شباهت زیادی به ChatGPT دارد، به طوری که ۷۴٪ از سبک نوشتاری آن با مدل OpenAI مطابقت دارد. این موضوع باعث ایجاد نگرانی‌هایی درمورد روش آموزش هوش مصنوعی DeepSeek و احتمال استفاده از داده‌های OpenAI بدون مجوز شده است.

آیا DeepSeek از داده‌های OpenAI بدون اجازه استفاده کرده است؟

تحقیقات چاپ‌شده در Forbes نشان می‌دهد که مدل DeepSeek R1 از نظر ساختار جملات، انتخاب کلمات و نحوه بیان اطلاعات شباهت زیادی به ChatGPT دارد.

مطالعه‌ Copyleaks از سه مدل پیشرفته هوش مصنوعی استفاده کرد که همگی به‌طور مستقل تأیید کردند که مدل DeepSeek R1، با چت جی‌پی‌تی از نظر سبک نوشتاری ۷۴.۲ درصد شباهت دارد.

بر اساس این تحقیق، DeepSeek احتمالاً از تکنیکی به نام «تقطیر دانش» یا «Knowledge Distillation» استفاده کرده است که در آن یک مدل جدید از روی داده‌های مدل‌های قدیمی‌تر آموزش می‌بیند. اگرچه DeepSeek ادعا می‌کند که فقط از داده‌های منبع‌باز استفاده کرده، اما برخی از محققان معتقدند ممکن است این شرکت از خروجی‌های ChatGPT در فرآیند آموزش خود بهره برده باشد.

اگر مشخص شود که این داده‌ها در آموزش DeepSeek R1 استفاده شده‌اند، شرکت دیپ‌سیک با چالش‌های قانونی جدی روبه‌رو می‌شود.

نکته جالب اینجاست که مایکروسافت، که بزرگ‌ترین سرمایه‌گذار OpenAI است، مدل DeepSeek R1 را در سرویس Azure AI Foundry خود قرار داده است.

این موضوع بحث‌برانگیز شده است؛ زیرا ممکن است مایکروسافت هم مجبور شود از این مدل فاصله بگیرد.

مشکلات دیگر DeepSeek: دقت پایین و امنیت ضعیف

DeepSeek فقط به دلیل احتمال استفاده غیرمجاز از داده‌های OpenAI تحت فشار نیست؛ بلکه مشکلات بزرگ دیگری هم دارد. بررسی‌ها نشان داده که مدل DeepSeek به‌راحتی قابل هک شدن است و مکانیزم‌های امنیتی بسیار ضعیفی دارد.

همچنین باید به این اشاره کنیم که پاسخ‌های DeepSeek در موضوعات سیاسی با دیدگاه‌های دولت چین همسو است که این موضوع باعث شده برخی کشورها نسبت به استفاده از آن محتاط‌تر باشند.

نظر شما چیست؟ آیا DeepSeek می‌تواند در رقابت با OpenAI دوام بیاورد؟