حاشیهها پیرامون هوش مصنوعی چینی deepseek زیاد بود، بهویژه که OpenAI اعلام کرده بود درحال بررسی احتمال نقض مالکیت و سرقت دادهها است. حالا مطالعه جدیدی که در ژورنال Forbes منتشر شده نشان میدهد مدل DeepSeek R1 شباهت زیادی به ChatGPT دارد، به طوری که ۷۴٪ از سبک نوشتاری آن با مدل OpenAI مطابقت دارد. این موضوع باعث ایجاد نگرانیهایی درمورد روش آموزش هوش مصنوعی DeepSeek و احتمال استفاده از دادههای OpenAI بدون مجوز شده است.
آیا DeepSeek از دادههای OpenAI بدون اجازه استفاده کرده است؟
تحقیقات چاپشده در Forbes نشان میدهد که مدل DeepSeek R1 از نظر ساختار جملات، انتخاب کلمات و نحوه بیان اطلاعات شباهت زیادی به ChatGPT دارد.
مطالعه Copyleaks از سه مدل پیشرفته هوش مصنوعی استفاده کرد که همگی بهطور مستقل تأیید کردند که مدل DeepSeek R1، با چت جیپیتی از نظر سبک نوشتاری ۷۴.۲ درصد شباهت دارد.
بر اساس این تحقیق، DeepSeek احتمالاً از تکنیکی به نام «تقطیر دانش» یا «Knowledge Distillation» استفاده کرده است که در آن یک مدل جدید از روی دادههای مدلهای قدیمیتر آموزش میبیند. اگرچه DeepSeek ادعا میکند که فقط از دادههای منبعباز استفاده کرده، اما برخی از محققان معتقدند ممکن است این شرکت از خروجیهای ChatGPT در فرآیند آموزش خود بهره برده باشد.
اگر مشخص شود که این دادهها در آموزش DeepSeek R1 استفاده شدهاند، شرکت دیپسیک با چالشهای قانونی جدی روبهرو میشود.
نکته جالب اینجاست که مایکروسافت، که بزرگترین سرمایهگذار OpenAI است، مدل DeepSeek R1 را در سرویس Azure AI Foundry خود قرار داده است.
این موضوع بحثبرانگیز شده است؛ زیرا ممکن است مایکروسافت هم مجبور شود از این مدل فاصله بگیرد.
مشکلات دیگر DeepSeek: دقت پایین و امنیت ضعیف
DeepSeek فقط به دلیل احتمال استفاده غیرمجاز از دادههای OpenAI تحت فشار نیست؛ بلکه مشکلات بزرگ دیگری هم دارد. بررسیها نشان داده که مدل DeepSeek بهراحتی قابل هک شدن است و مکانیزمهای امنیتی بسیار ضعیفی دارد.
همچنین باید به این اشاره کنیم که پاسخهای DeepSeek در موضوعات سیاسی با دیدگاههای دولت چین همسو است که این موضوع باعث شده برخی کشورها نسبت به استفاده از آن محتاطتر باشند.
نظر شما چیست؟ آیا DeepSeek میتواند در رقابت با OpenAI دوام بیاورد؟