میدجرنی بعد از رونمایی از  نسخه 6 Midjourney خبر خوش دیگری را برای طرفداران خود دارد. میدجرنی یکی از محبوب ترین ابزارهای هوش مصنوعی ساخت عکس است که از اوایل معرفی تا کنون توانسته افراد زیادی را به خود جذب کند و همچنین کمپانی های زیادی را به رقابت بکشاند.

میدجرنی قصد دارد قابلیت های خود را گسترش دهد و می خواهد یک مدل “متن به ویدیو” را طی چند ماه آینده معرفی کند. قبل از میدجرنی، لئوناردو رقیب آن اعلام کرده بود که امکان ساخت ویدیو را هم اضافه کرده است.

رویکرد میدجرنی در تولید هوش مصنوعی

کاربران میدجرنی این هوش مصنوعی به کیفیت بالا، تجربه کاربری خوب و سرعت می‌شناسند. 2 ویژگی inpainting و outpainting هم از نمونه آپدیت هایی بوده که در میدجرنی اضافه شده و به کاربران این امکان را می دهد تا بخش هایی از تصویر را پر کنند یا گسترش دهند.

رقابت میدجرنی در حوزه ویدیو

طبق اعلام hyscaler، میدجرنی با ورود به حوزه ویدیو، چالش های زیادی را در پیش خواهد داشت؛ چرا که رقبای زیادی را در این حوزه دارد که بسیارقوی کار کرده‌اند و می توان از آن‌ها خروجی های باکیفیت تحویل گرفت. شرکت Stability AI به تازگی مدل Stable Video Diffusion را معرفی کرده است، یک مدل که می‌تواند ویدیوهای واقع‌گرایانه و متنوع را از دستورات متنی تولید کند.

Meta، غول رسانه‌های اجتماعی، همچنین مولفه ویدیو EMU خود را نشان داده است که می‌تواند ویدیوهای جذاب و تعاملی را از پرسش‌های زبان طبیعی ایجاد کند. علاوه بر این، مدل‌های موجود مانند Pika و Runway ML نیز در بازار حضور دارند و ویژگی‌ها و کاربردهای مختلفی را برای تولید ویدیو ارائه می‌دهند.

به طور کلی رقابت بین انواع هوش مصنوعی ساخت ویدیو سخت و تنگاتنگ است.

تفاوت مدل تصویر و مدل ویدیوی میدجرنی چیست؟

 هوش مصنوعی ساخت عکس میدجرنی از سال 2022 منتشر شده و تا کنون چندین بار آپدیت شده است. آخرین نسخه میدجرنی می تواند تصاویر واقع گرایانه و با جزئیات بیشتر نسبت به نسخه قبلی ایجاد کند. بهبودهای مختلفی مانند inpainting، outpainting، tiling و استایلینگ نیز توسط مدل تصویر پشتیبانی می‌شوند. این مدل تصویر قادر است تصاویر را در حوزه‌های مختلف ایجاد کند، از جمله مانگا، انیمه، مناظرهای طبیعی، پرتره‌ها و دیگران.

مدل ویدیوی میدجرنی مدل جدیدتری است که در حال آزمایش و توسعه است و در ماه های آتی منتشر خواهد شد. این مدل ویدیو بر اساس مدل تصویر خواهد بود و قابلیت تولید فیلم‌های کوتاه بر اساس دستورات متنی را نیز خواهد داشت. مدل ویدیوی میدجرنی بر اساس متن به ویدیو، ویدیوها را تولید می کند که با دستورات زبان طبیعی کاربر هماهنگ می شود.

ویژگی مشترک بین این دو مدل، ارائه خروجی باکیفیت بالا و کاربر پسند است. مدل ویدیوی میدجرنی نوآورانه‌تر و جذاب‌تر است، در حالی‌که مدل تصویر پایدارتر و چندکاره‌تر است.