گزارش‌هایی به گوش می‌رسد که شرکت‌های دارای هوش مصنوعی مانند  OpenAI ، Google و Meta برای آموزش به مدل های هوش مصنوعی خود دست به تکنیک‌های مبهم و ناقض حقوق هنرمندان زده‌اند. ظاهراً OpenAI بیش از یک میلیون ساعت از ویدیوهای YouTube را برای آموزش پیشرفته‌ترین مدل زبان بزرگ خود (LLM) یعنی GPT-4 رونویسی کرده است!

استفاده openAI از ویدیوهای یوتیوب

بر اساس گزارش‌ها، OpenAI یک مدل رونویسی صوتی به نام Whisper توسعه داده است که به جمع‌آوری داده‌های ویدیوهای YouTube کمک می‌کند و بیش از یک میلیون ساعت از ویدیوهای YouTube را بدون اجازه هنرمندان و مولفان استفاده کرده است! گزارش نیویورک تایمز نشان می‌دهد که OpenAI آگاه بوده که این کار مشکل‌زا و بحث برانگیز است اما به کارش ادامه داده و متعقد بوده که اشکالی ندارد! جالب اینجاست که گوگل هم که مالک یوتیوب است، ظاهراً در اجرای همین کار برای مدل‌های هوش مصنوعی خود نیز مشارکت داشته است و در نتیجه حقوق مؤلف خود را نقض کرده است.

لیندزی هلد، سخنگوی OpenAI در مورد این اتهامات گفت که آن‌ها از منابع متعددی برای آموزش مدل‌های خود استفاده می‌کنند (که شامل داده‌های عمومی و غیر عمومی می‌شود) تا هم به درک مدل‌های هوش مصنوعی خود از جهان کمک کند و هم رقابت تحقیقاتی جهانی خود را حفظ کنند. بنابراین با خیال راحت چنین کاری را انجام داده‌اند!

خبرها پیرامون ابزارهای هوش مصنوعی OpenAI این روزها داغ است،‌ پیش از این هم شنیده بودیم ویرایش تصاویر DALL-E 3 از طریق چت جی‌پی‌تی فراهم شد