سم آلتمن، مدیرعامل OpenAI روز گذشته از اولین آپدیت بزرگ قابلیت تولید تصویر در ChatGPT خبر داد. این آپدیت پس از یک سال انجام شده و اتفاق مهمی است که در این خبر نامبرلند به آن میپردازیم.
ساخت انیمه با Chatgpt-4o
از حالا به بعد میتوانید مستقیما در ChatGPT با مدل GPT-4o بهصورت بومی (native) تصاویر و عکسها را تولید و ویرایش کنید. اگرچه GPT-4o مدتی است که پایهی اصلی چتبات ChatGPT محسوب میشود، اما تا پیش از این فقط امکان تولید و ویرایش متن را داشت ولی تصویر نه. تصویر زیر نمونهای از این مدل جدید است:

به گفته وبلاگ OpenAI، این قابلیت از امروز برای کاربران chatgpt pro در ChatGPT و Sora (پلتفرم ساخت ویدیو با هوش مصنوعی OpenAI) فعال شده است. همچنین OpenAI اعلام کرده این ویژگی بهزودی برای کاربران طرح پلاس، رایگان و توسعهدهندگان API نیز عرضه خواهد شد.
برخلاف مدل قبلی تولید تصویر یعنی دالای سه GPT-4o در فرآیند تولید تصویر کمی بیشتر «فکر» میکند تا بتواند خروجیهایی دقیقتر و با جزئیات بیشتر ارائه دهد.
این مدل نهتنها میتواند تصاویر را از صفر بسازد، بلکه قابلیت ویرایش عکسهای موجود، حتی تصاویر حاوی چهره انسان را نیز دارد؛ از جمله تغییر دادن یا بازسازی بخشهایی مثل پیشزمینه و پسزمینه.
برای توسعه این قابلیت جدید، OpenAI مدل GPT-4o را با استفاده از دادههای «در دسترس عموم» و همچنین دادههای اختصاصی از همکاری با شرکتهایی مانند Shutterstock آموزش داده است. البته برد لایتکپ، مدیر اجرایی OpenAI، درباره مسائل حقوقی قانون کپیرایت گفته: «ما حقوق هنرمندان را در نحوه تولید تصویر رعایت میکنیم و سیاستهایی داریم که مانع از تولید تصاویری میشود که مستقیماً از سبک هنرمندان زنده تقلید میکنند.»
این آپدیت جدید درست پس از معرفی هوش مصنوعی Gemini 2.5 صورت گرفته است که جدیدترین مدل استدلالگر گوگل است.