دیروز هوش مصنوعی Mogao معرفی شد و در از همان ساعات اول، همه را شوکه کرد! هوش مصنوعی Mogao یک مدل تبدیل متن به تصویر (Text-to-Image Model) است که در تحلیل Artificial Analysis Image Arena توانسته بالاترین رتبه را بگیرد و از مدل‌های مشهور و قدرتمندی مثل GPT-4o یا ایدوگرام هم جلو بزند.

تا اینجای کار به نظر می‌رسد مهم‌ترین نکته درباره هوش مصنوعی Mogao این است که در دقت به دستورات (Prompt Adherence) بسیار قوی عمل می‌کند. کاربران در شبکه‌های اجتماعی مختلف از جمله reddit، خروجی‌های این مدل را تحسین کرده‌اند و می‌گویند این مدل در تولید انیمه و کارتون بسیار قوی است و خیلی دقیق به پرامپت‌ها وفادار است.

البته کاربران به ایرادات این مدل هم اشاره‌هایی کرده‌اند. به‌طور مثال مدل Mogao زیبایی‌شناسی قدرتمندی ندارد و در بخش رنگ‌ها و پرسپکتیو از مدل‌هایی مثل آیدیوگرام ضعیف‌تر است. همچنین این مدل نمی‌تواند متن را در تصاویر به‌خوبی بگنجاند.

از نظر فنی اطلاعات بیشتری درباره ساختار مدل Mogao در دسترس نیست، چراکه سازنده‌هایش هنوز جزئیات بیشتری را منتشر نکرده‌اند.

پیش از این هم دیده بودیم که ابزار تصویرساز DALL-E 3 با قابلیت‌های بسیار جالبی آپدیت شده است.