میدجرنی بعد از رونمایی از نسخه 6 Midjourney خبر خوش دیگری را برای طرفداران خود دارد. میدجرنی یکی از محبوب ترین ابزارهای هوش مصنوعی ساخت عکس است که از اوایل معرفی تا کنون توانسته افراد زیادی را به خود جذب کند و همچنین کمپانی های زیادی را به رقابت بکشاند.
میدجرنی قصد دارد قابلیت های خود را گسترش دهد و می خواهد یک مدل “متن به ویدیو” را طی چند ماه آینده معرفی کند. قبل از میدجرنی، لئوناردو رقیب آن اعلام کرده بود که امکان ساخت ویدیو را هم اضافه کرده است.
رویکرد میدجرنی در تولید هوش مصنوعی
کاربران میدجرنی این هوش مصنوعی به کیفیت بالا، تجربه کاربری خوب و سرعت میشناسند. 2 ویژگی inpainting و outpainting هم از نمونه آپدیت هایی بوده که در میدجرنی اضافه شده و به کاربران این امکان را می دهد تا بخش هایی از تصویر را پر کنند یا گسترش دهند.
رقابت میدجرنی در حوزه ویدیو
طبق اعلام hyscaler، میدجرنی با ورود به حوزه ویدیو، چالش های زیادی را در پیش خواهد داشت؛ چرا که رقبای زیادی را در این حوزه دارد که بسیارقوی کار کردهاند و می توان از آنها خروجی های باکیفیت تحویل گرفت. شرکت Stability AI به تازگی مدل Stable Video Diffusion را معرفی کرده است، یک مدل که میتواند ویدیوهای واقعگرایانه و متنوع را از دستورات متنی تولید کند.
Meta، غول رسانههای اجتماعی، همچنین مولفه ویدیو EMU خود را نشان داده است که میتواند ویدیوهای جذاب و تعاملی را از پرسشهای زبان طبیعی ایجاد کند. علاوه بر این، مدلهای موجود مانند Pika و Runway ML نیز در بازار حضور دارند و ویژگیها و کاربردهای مختلفی را برای تولید ویدیو ارائه میدهند.
به طور کلی رقابت بین انواع هوش مصنوعی ساخت ویدیو سخت و تنگاتنگ است.
تفاوت مدل تصویر و مدل ویدیوی میدجرنی چیست؟
هوش مصنوعی ساخت عکس میدجرنی از سال 2022 منتشر شده و تا کنون چندین بار آپدیت شده است. آخرین نسخه میدجرنی می تواند تصاویر واقع گرایانه و با جزئیات بیشتر نسبت به نسخه قبلی ایجاد کند. بهبودهای مختلفی مانند inpainting، outpainting، tiling و استایلینگ نیز توسط مدل تصویر پشتیبانی میشوند. این مدل تصویر قادر است تصاویر را در حوزههای مختلف ایجاد کند، از جمله مانگا، انیمه، مناظرهای طبیعی، پرترهها و دیگران.
مدل ویدیوی میدجرنی مدل جدیدتری است که در حال آزمایش و توسعه است و در ماه های آتی منتشر خواهد شد. این مدل ویدیو بر اساس مدل تصویر خواهد بود و قابلیت تولید فیلمهای کوتاه بر اساس دستورات متنی را نیز خواهد داشت. مدل ویدیوی میدجرنی بر اساس متن به ویدیو، ویدیوها را تولید می کند که با دستورات زبان طبیعی کاربر هماهنگ می شود.
ویژگی مشترک بین این دو مدل، ارائه خروجی باکیفیت بالا و کاربر پسند است. مدل ویدیوی میدجرنی نوآورانهتر و جذابتر است، در حالیکه مدل تصویر پایدارتر و چندکارهتر است.