اگر پیگیر اخبار تکنولوژی باشید حتما درباره sora شنیده‌اید. sora هوش مصنوعی ویدیوساز شرکت اوپن ای آی است که به تازگی منتشر شده و هرچه درباره اش بگوییم کم است! محتوای تولید شده توسط سورا آنقدر باورنکردنی است که فقط باید ببینید تا باورتان شود از چه صحبت می کنیم. در این بلاگ نامبرلند همه چیزهایی که باید درباره سورا بدانیم و چندین ویدیوی مختلفش را برایتان گذاشته‌ایم.

مثلا ویدیوی زیر که تصویر چشمان یک زن از نزدیک است را از نزدیک ببینید؛‌ آیا باورتان می شود واقعی نباشد؟

sora:‌ انقلابی در هوش مصنوعی‌های ویدیوساز

اخبار مربوط به Sora همه اینترنت را پر کرده،‌ این هوش مصنوعی قادر است ویدیوهایی بسازد که به طرز ترسناکی مشابه دنیای واقعی است. سورا دقیقا چیست؟

هوش مصنوعی sora دقیقا چیست؟

Sora یک مدل هوش مصنوعی تبدیل متن به ویدئو است که توسط سازندگان چت جی‌پی‌تی یعنی کمپانی OpenAI  توسعه یافته است. اصطلاح «تبدیل متن به ویدیو» به این معنی است که سورا درخواست های متنی را از شما می‌گیرد و آن را به کلیپ های ویدیویی کوتاه تبدیل می کند. کمپانی OpenAI در وبلاگ رسمی‌اش درباره توضیح سورا اینطور نوشته:‌

«سورا می‌تواند صحنه‌های پیچیده با شخصیت‌های متعدد، انواع حرکات خاص و پیچیده، با جزئیات دقیق سوژه و یک پس‌زمینه بدون خطا را تولید کند.» این مدل نه تنها قادر است درخواست کاربر را به خوبی درک کند، بلکه چیستی و چگونگی وجود موارد درخواست شده در دنیای فیزیکی را نیز درک می‌کند.

ساز و کار هوش مصنوعی sora|‌ soraچگونه کار می‌کند؟

تکنولوژی سورا مشابه مدل‌های زبانی خانواده جی‌پی‌تی کار می‌کند. همه آن‌ها از معماری “ترانسفورماتور” استفاده می‌کنند؛ نوعی شبکه عصبی که ورودی را دریافت می‌کند و آن را به خروجی “تبدیل” می کند. آن‌ها همچنین از یک سری توانایی های DALLE-3 مانند سیستم بازنویسی استفاده کرده‌اند. در ادامه چند ویژگی مهم سورا را باهم مرور می‌کنیم.

ساخت ویدیو دقیقا مثل واقعیت

سورا قادر است به طرز عجیبی واقع گرایانه ویدیو بسازد طوری که در نگاه اول هرگز حدس نخواهید زد که ساخته شده توسط هوش مصنوعی است! حتی در نگاه دوم و سوم هم تشخیص نخواهید داد که این ویدیوها واقعی نیست!‌ به همین جهت تمام ویدیوها واترمارک اوپن ای‌آی را روی خود دارند تا بلکه از این طریق قابل تشخیص باشد.

تبدیل متن به ویدئو

ویژگی متمایز Sora AI نسبت به دیگر ابزارهای ویدیوساز، توانایی فوق العاده‌ بالایش برای درک دقیق درخواست‌های (پرامپت‌) متنی و تبدیل آن‌ها به کلیپ های ویدیویی با کیفیت است. این ویژگی بسیار مهمی است چراکه یکی از مشکلات بزرگ با ابزارهای هوش مصنوعی را حل کرده و فرصت بسیار خوبی را برای سازندگان ویدیو در صنایع مختلف فراهم می‌کند که ایده های خود را به راحتی به واقعیت تبدیل کنند.

سورا می تواند هر ویدیویی برای شما بسازد،‌ از منظره های شهری پویا گرفته تا انیمیشن و کارتن!‌

تولید ویدیو از روی یک عکس یا ساخت ادامه ویدیو

این مدل علاوه بر اینکه می‌تواند یک ویدیو را صرفاً از دستورالعمل‌های متنی تولید کند، می‌تواند یک تصویر را دریافت کند و از آن فیلم بسازد و محتوای تصویر را با دقت و توجه به جزئیات بسیار ریز آن، متحرک کند. این مدل همچنین می‌تواند یک ویدیو را دریافت کند و آن را گسترش دهد (یا فریم‌های از دست رفته را پر کند.

Sora به عنوان پایه ای برای مدل هایی عمل می کند که می توانند دنیای واقعی را درک و شبیه سازی کنند، قابلیتی که ما معتقدیم نقطه عطف مهمی برای دستیابی به AGI خواهد بود.

چه کسانی به sora دسترسی دارند؟

Sora در حال حاضر فقط برای محققان امنیتی که مسئول اطمینان از ایمن بودن سورا هستند در دسترس است و برای عموم مردم در دسترس نیست.

در حال حاضر تاریخ انتشار Sora مشخص نیست و تمام ویدیوهای سورا که در چند روز گذشته در اینترنت پخش شده است، از پست وبلاگی OpenAI برداشته شده است.

OpenAI تا به حال هیچ نشانه و خبری هم درباره اینکه سورا چه زمانی و برای چه کسانی در دسترس خواهند بود نداده،‌ حتی ممکن است کلا امسال عرضه نشود و این موضوع کاملاً غیرمعمول است و می‌تواند نشانه‌ای باشد که مدت خیلی زیادی تا انتشار عمومی‌اش مانده.

مقایسه sora با دیگر ابزارهای هوش مصنوعی ویدیوساز

sorapikarunway
تمرکزمتمرکز بر ساخت ویدیوهای واقع گرایانهمتمرکز بر ساخت ویدیو از روی تصویر در استایل انیمیشنمتمرکز بر ویرایش ویدیو
مدت زمانتا ۶۰ ثانیه۳ ثانیه۴ ثانیه
کاراییبسیار قویضعیفنسبتا قوی
نوع درخواست یا ورودیمتنیتصویری،‌ به همراه کمی توضیحات متنیتصویر، ویدیو،‌متن
استایل خروجیبسیار واقع گرایانههنری و انیمیشنمتنوع و شامل استایل‌های مختلف
قیمتنامشخصرایگانپولی
محدودیت‌هانامشخصدرخواست‌های پیچیده را به خوبی اجرا نمی‌کندخروجی احتیاج به ویرایش دارد
نقاط قوتواقع گرایانه،‌ خطای بسیار کمپویانمایی خلاقانه، افکت‌های جالبتطبیق پذیر
امکان شخصی سازی شدننامشخصدارددارد

مشکلات فعلی sora

البته که مدل فعلی سورا دارای نقاط ضعف مختلفی است! مثلا ممکن است با شبیه سازی دقیق و اصولی یک صحنه پیچیده مشکل داشته باشد یا ممکن است چگونه انجام شدن یک اتفاق در ویدیو را درک نکند. به عنوان مثال، ممکن است فردی به یک بیسکوییت گاز بزند اما پس از دو ثانیه ببینید بیسکوییت سالم و بدون جای خورده شدن باشد!

اثرات سورا بر جامعه

معرفی Sora AI تغییر گسترده ای در تولید محتوا در صنایع مختلف ایجاد می کند. در نتیجه، این فناوری برای فیلمسازان، هنرمندان،‌ فعالان در صنعت تبلیغات و.. یک موهبت عالی است. هنوز که این ابزار منتشر نشده اما وقتی منتشر شد برای تولید سریع و کارآمد محتوای ویدیویی استفاده های فراوان دارد که زمان و هزینه تولید را برای طراحان کاهش می دهد.

اما مانند هر فناوری پیشرفته دیگری در دنیای هوش مصنوعی، سورا می‌تواند پیامدهای اخلاقی قابل توجهی به همراه داشته باشد. کمپانی OpenAI از این نگرانی‌ها آگاه است و اقدامات ایمنی کارآمدی را برای جلوگیری از سوء استفاده‌ها به کار گرفته است، به عنوان مثال، فیلترهایی برای نوشتن درخواست تولید محتوا و دستورالعمل های استفاده وجود دارد.