دیروز هوش مصنوعی Mogao معرفی شد و در از همان ساعات اول، همه را شوکه کرد! هوش مصنوعی Mogao یک مدل تبدیل متن به تصویر (Text-to-Image Model) است که در تحلیل Artificial Analysis Image Arena توانسته بالاترین رتبه را بگیرد و از مدلهای مشهور و قدرتمندی مثل GPT-4o یا ایدوگرام هم جلو بزند.
تا اینجای کار به نظر میرسد مهمترین نکته درباره هوش مصنوعی Mogao این است که در دقت به دستورات (Prompt Adherence) بسیار قوی عمل میکند. کاربران در شبکههای اجتماعی مختلف از جمله reddit، خروجیهای این مدل را تحسین کردهاند و میگویند این مدل در تولید انیمه و کارتون بسیار قوی است و خیلی دقیق به پرامپتها وفادار است.
البته کاربران به ایرادات این مدل هم اشارههایی کردهاند. بهطور مثال مدل Mogao زیباییشناسی قدرتمندی ندارد و در بخش رنگها و پرسپکتیو از مدلهایی مثل آیدیوگرام ضعیفتر است. همچنین این مدل نمیتواند متن را در تصاویر بهخوبی بگنجاند.
از نظر فنی اطلاعات بیشتری درباره ساختار مدل Mogao در دسترس نیست، چراکه سازندههایش هنوز جزئیات بیشتری را منتشر نکردهاند.
پیش از این هم دیده بودیم که ابزار تصویرساز DALL-E 3 با قابلیتهای بسیار جالبی آپدیت شده است.