گزارشهایی به گوش میرسد که شرکتهای دارای هوش مصنوعی مانند OpenAI ، Google و Meta برای آموزش به مدل های هوش مصنوعی خود دست به تکنیکهای مبهم و ناقض حقوق هنرمندان زدهاند. ظاهراً OpenAI بیش از یک میلیون ساعت از ویدیوهای YouTube را برای آموزش پیشرفتهترین مدل زبان بزرگ خود (LLM) یعنی GPT-4 رونویسی کرده است!
استفاده openAI از ویدیوهای یوتیوب
بر اساس گزارشها، OpenAI یک مدل رونویسی صوتی به نام Whisper توسعه داده است که به جمعآوری دادههای ویدیوهای YouTube کمک میکند و بیش از یک میلیون ساعت از ویدیوهای YouTube را بدون اجازه هنرمندان و مولفان استفاده کرده است! گزارش نیویورک تایمز نشان میدهد که OpenAI آگاه بوده که این کار مشکلزا و بحث برانگیز است اما به کارش ادامه داده و متعقد بوده که اشکالی ندارد! جالب اینجاست که گوگل هم که مالک یوتیوب است، ظاهراً در اجرای همین کار برای مدلهای هوش مصنوعی خود نیز مشارکت داشته است و در نتیجه حقوق مؤلف خود را نقض کرده است.
لیندزی هلد، سخنگوی OpenAI در مورد این اتهامات گفت که آنها از منابع متعددی برای آموزش مدلهای خود استفاده میکنند (که شامل دادههای عمومی و غیر عمومی میشود) تا هم به درک مدلهای هوش مصنوعی خود از جهان کمک کند و هم رقابت تحقیقاتی جهانی خود را حفظ کنند. بنابراین با خیال راحت چنین کاری را انجام دادهاند!
خبرها پیرامون ابزارهای هوش مصنوعی OpenAI این روزها داغ است، پیش از این هم شنیده بودیم ویرایش تصاویر DALL-E 3 از طریق چت جیپیتی فراهم شد