اگر اهل دنیای تکنولوژی و هوش مصنوعی باشید،‌ حتما می‌دانید که یکی از قابلیت‌های هوش مصنوعی،‌ ساخت تصویر، ویدیو و آثار هنری است. ابزارهای هوش مصنوعی زیادی در دنیا وجود دارند که می‌توانند عکس و تصویر بسازند،‌ و یکی از معروف‌ترین‌ها Stable Diffusion است. در این مقاله نامبرلند در مورد اینکه Stable Diffusion چیست، چه مزایا و کاربردهایی نسبت به دیگر ابزارها دارد و نحوه استفاده از آن برایتان همه چیز را توضیح داده‌ایم.

استیبل دیفیوژن چیست؟

اول از همه، بیایید ببینیم که Stable Diffusion چیست! Stable Diffusion یک مدل deep learning است که از فرآیندهای انتشار (Diffusion) برای تولید آثار هنری بسیار باکیفیت استفاده می کند.

به عبارت ساده، هنگامی که به Stable Diffusion یک پرامپت (دستور متنی) بدهید‌، مدل دستور شما را می‌خواند و  تصویری واقعی با توجه به توضیحات شما ایجاد می‌کند.

هوش مصنوعی Stable Diffusion می‌تواند طیف گسترده ای از سبک های هنری از جمله پرتره‌های فوتورئالیستی، منظره‌های طبیعی و یا هنرهای انتزاعی را تولید کند و از این بابت بسیار حرفه‌ای است.

این هوش مصنوعی بسیار قدرتمند است؛ چراکه می‌تواند متنی با توصیفات پیچیده و انتزاعی را درک و براساس آن،‌ تصویر تولید کند.

بیشتر بخوانید: ساخت عکس با هوش مصنوعی

مزایای استیبل دیفیوژن نسبت به سایر مدل‌های مشابه

مدل Stable Diffusion مانند دیگر مدل‌های ساخت تصویر، از جمله میدجرنی،‌ یکسری مزایا و فواید ویژه دارد، که آن را تبدیل به یک انتخاب برتر کرده است.

  • یکی از مزایای قابل توجه Stable Diffusion منبع باز بودن آن است. منبع باز یا اوپن سورس بودن (open source) به این معنی است که معماری مدل، کد و ابزارهای مرتبط آن برای همه در دسترس است. بنابراین همه چیز برای کاربرانش شفاف است.
  • مزیت دیگر این هوش مصنوعی،‌ این است که شما می‌توانید از آن روی سایت‌های آنلاین استفاده کنید و نیازی به نصب یک برنامه سنگین پرحجم نیست.
  • همچنین استیبل دیفیوژن رایگان است!
  • در نهایت شاید بتوان مهم‌ترین مزیت این هوش مصنوعی قدرتمند را،‌ رعایت حریم خصوصی کاربران ذکر کرد. طبق ادعای وبسایت استیبل دیفیوژن،‌ آن‌ها هیچ اطلاعات و داده‌ای از کاربرانش را جمع نمی‌کنند؛ حتی از ورودی‌های کاربران برای آموزش مدل خود استفاده نمی‌کنند.

کاربردهای استیبل دیفیوژن چیست؟

کار با مدل‌های هوش مصنوعی هنری لذت بخش و جالب است، اما غیر از جنبه سرگرمی،‌ استیبل دیفیوژن کاربردهای فراوان دیگری هم دارد که بسیار حرفه‌ای و تخصصی است. در ادامه چند مورد را برایتان لیست کرده‌ایم:

  • ساخت عکس با درخواست متنی
  • ساخت عکس از روی یک عکس دیگر
  • ادیت و ویرایش یک عکس
  • حذف یا اضافه کردن جزییات تصویر
  • ساخت انواع تصاویر در سبک‌های هنری مختلف
  • تبدیل یک اسکچ به یک تصویر رئال (واقع‌گرایانه)
  • ادغام چهره یک شخص با تصویر مورد نظر
  • استفاده در مارکتینگ و تبلیغات
  • استفاده در معماری و گرافیک

آیا Stable Diffusion رایگان است؟

همانطور که گفتیم Stable Diffusion منبع باز و رایگان است. شما می‌توانید در وبسایت رسمی Stable Diffusion به رایگان در عرض چند ثانیه عکس بسازید!

با این وجود، بسته‌های اشتراک ماهانه برای دولوپرها و دیگر افرادی که به دنبال ویژگی‌های پیشرفته و قابلیت‌های بیشتر این ابزار هستند، در دسترس است.

نحوه استفاده از هوش مصنوعی Stable Diffusion

شما می‌توانید برنامه استیبل دیفیوژن را روی سیستم عامل خود نصب کنید و یا در وبسایت رسمی‌اش از این هوش مصنوعی استفاده کنید.

روش اول:‌ نصب استیبل دیفیوژن

نصب آن سخت است و نیاز به یک سیستم عامل بسیار قدرتمند دارد. (ویندوز ۱۰ به بالا،‌ Nvidia GPU RTX با حداقل 12 گیگابایت VRAM و فضای ذخیره سازی روی هارد دیسک بالای ۱۰ گیگ). سپس‌ باید Git و Miniconda3  را نصب کنید، فایل های استیبل دیفیوژن را از GitHub بگیرید و محیط پایتون مخصوصش را بسازید.

در نهاین چک پوینت‌های مورد نظرتان را از HuggingFace.co دانلود کنید و در پوشه استیبل دیفیوژن قرار دهید. حالا می‌توانید عکس های دلخواهتان را بسازید!

روش دوم:‌ استفاده از وبسایت به صورت رایگان

راه دیگر این است که خیلی راحت به وبسایت اصلی استیبل دیفیوژن مراجعه کنید و تصاویر خود را بسازید!

قدم اول: به سایت استیبل دیفیوژن بروید.

قدم دوم: پیام متنی خود را در قسمت txt2img وارد کنید.

قدم سوم:‌ روی دکمه «generate»‌ کلیک کنید و عکس خود را تحویل بگیرید!

اگر تصویر با چیزی که می‌خواستید مطابقت نداشت، اشکالی ندارد. می توانید توضیحات خود را تغییر دهید یا ابزارها را تنظیم کنید و مراحل را دوباره تکرار کنید.

چند ترفند برای استفاده از استیبل دیفیوژن:

بازسازی چهره

با وجود همه توانایی‌های استیبل دیفیوژن،‌ اما این هوش مصنوعی در ساخت چهره خیلی خوب عمل نمی‌کند. مثلا صورت افراد را بدفرم یا بهم ریخته می‌سازد. راه حل این مشکل این است که از یک مدل هوش مصنوعی دیگر برای رفع این ایرادات استفاده کنید.

البته گاهی اوقات با استفاده از inpainting این ایراد برطرف می‌شود.

2-رفع اشکالات کوچک با inpainting

این‌پینتگ یا همان inpainting یک راه حل خوب برای برطرف کردن ایرادات تصاویر ساخته شده با استیبل دیفیوژن است. وقتی استیبل دیفیوژن به شما تصویری را تحویل داد و از آن راضی نبودید،‌ کافی است که پرامپت خود را اصلاح کنید و دوباره بنویسید.

3-چاپ تصاویر بزرگ

تصاویر خروجی استیبل دیفیوژن عموما ۵۱۲*۵۱۲ پیکسل هستند،‌ البته تصاویر ورژن ۱ و ۱.۵،‌ رزولوشین متفاوتی دارند. برای چاپ تصاویر بزرگ از این ابعاد استفاده کنید:

تصویر منظره:‌ نسبت ابعاد ۲:۳

تصویر پرتره:‌ نسبت ابعاد ۳:۲

آشنایی با ابزارهای مختلف استیبل دیفیوژن

استیبل دیفیوژن به عنوان یک هوش مصنوعی ساخت تصویر،‌ از پارامترها و ابزارهای مختلفی استفاده می‌کند تا کیفیت تصاویرش را بالا ببرد.

Seed

ابزار Seed یک عدد است که رنگ و نورپردازی تصویر را تنظیم می‌کند. شما با بالا و پایین کردن این عدد می‌توانید رنگ و نور تصویر خود را تغییر دهید.

Upscaler

استیبل دیفیوژن می‌تواند از شما تصویر دریافت کند تا از روی آن برایتان تصویر تولید کند، اما اگر کیفیت تصویر شما پایین باشد،‌ چه؟‌! خب استیبل دیفیوژن با استفاده از‌ ابزار Upscaler کیفیت و رزولوشن تصاویر ورودی را بالا می‌برد.

Sampling Steps

ابزار Sampling Steps همانطور که از اسمش پیداست به مراحل ساخت عکس اشاره دارد. هوش مصنوعی استیبل دیفیوژن در یک مرحله تصویر شما را نمی‌سازد، بلکه طی چندین مرحله عکس درخواستی را تولید می‌کند و هربار آن را بهبود می‌بخشد تا به شما تحویل دهد. و عددی که Sampling Steps نشان می‌دهد، نشان دهنده تعداد این مراحل است.

CFG scale

Classifier Free Guidance scale یا همان CFG در استیبل دیفیوژن ابزاری است که خلاقیت یا پایبندی به پرامپت استیبل دیفیوژن را مشخص می‌کند. به عبارت دیگر هرچه عدد CFG بالاتر باشد یعنی آزادی استیبل دیفیوژن محدودتر است و باید به پرامپتی که گرفته پایبند باشد.

استیبل دیفیوژن در یک پاراگراف

در این مقاله نامبرلند مفصل درباره هوش مصنوعی تصویرساز Stable Diffusion صحبت کردیم و توضیح دادیم که این هوش مصنوعی با چه ابزارهایی کار می‌کند،‌ چه کاربردهایی دارد و چطور می‌توان به رایگان بهترین تصویرها را با استیبل دیفیوژن ساخت.

استیبل دیفیوژن چیست؟

Stable Diffusion  یک هوش مصنوعی پیشرفته و قدرتمند ساخت تصویر است که می‌تواند از شما دستور متنی بگیرد یا حتی یک عکس بگیرد و براساس آن،‌ تصویر دیگری تولید کند.

چگونه یک پرامپت خوب برای استیبل دیفیوژن بنویسیم؟

برای اینکه دقیقا تصویر موردنظر خودتان را دریافت کنید،‌ باید دقیق،‌ واضح و مشخص خواسته خود را ذکر کنید. مثال درست:‌ «یک گربه سفید از نژاد پرشین که زیر نور آفتاب دراز کشیده برایم بساز.»
مثال غلط:‌ «یک گربه بساز»

آیا استیبل دیفیوژن رایگان است؟

بله، Stable Diffusion در حال حاضر به صورت رایگان هم از طریق وب و هم از طریق نصب بر روی دیوایس شما قابل دسترسی است.

آیا می توان از Stable Diffusion برای ویرایش ویدیو استفاده کرد؟

Stable Diffusion در اصل برای تولید و ویرایش تصویر طراحی شده است. با این حال، می توان آن را برای ویرایش ویدیو با پردازش فریم های جداگانه به صورت متوالی استفاده کرد.

مزایای استفاده از Stable Diffusion چیست؟

استیبل دیفیوژن تصاویر بسیار باکیفیت و واقع گرایانه تولید می‌کند و در درک پرامپت کاربران بسیار دقیق است.

آیا Stable Diffusion با سیستم عامل های مختلف سازگار است؟

Stable Diffusion را می توان برای سازگاری با سیستم عامل های مختلف از جمله Windows، macOS  و Linux قابل توسعه است.

از کجا می توانم به Stable Diffusion به صورت رایگان دسترسی داشته باشم؟

خیلی راحت از وب سایت رسمی Stable Diffusion Online دیدن کنید. این پلتفرم رابط کاربری ساده‌ای دارد و کافی است یک پرامپت واضح بنویسید،‌ عکس تحویل بگیرید!