اگر اهل دنیای تکنولوژی و هوش مصنوعی باشید، حتما میدانید که یکی از قابلیتهای هوش مصنوعی، ساخت تصویر، ویدیو و آثار هنری است. ابزارهای هوش مصنوعی زیادی در دنیا وجود دارند که میتوانند عکس و تصویر بسازند، و یکی از معروفترینها Stable Diffusion است. در این مقاله نامبرلند در مورد اینکه Stable Diffusion چیست، چه مزایا و کاربردهایی نسبت به دیگر ابزارها دارد و نحوه استفاده از آن برایتان همه چیز را توضیح دادهایم.
استیبل دیفیوژن چیست؟
اول از همه، بیایید ببینیم که Stable Diffusion چیست! Stable Diffusion یک مدل deep learning است که از فرآیندهای انتشار (Diffusion) برای تولید آثار هنری بسیار باکیفیت استفاده می کند.
به عبارت ساده، هنگامی که به Stable Diffusion یک پرامپت (دستور متنی) بدهید، مدل دستور شما را میخواند و تصویری واقعی با توجه به توضیحات شما ایجاد میکند.
هوش مصنوعی Stable Diffusion میتواند طیف گسترده ای از سبک های هنری از جمله پرترههای فوتورئالیستی، منظرههای طبیعی و یا هنرهای انتزاعی را تولید کند و از این بابت بسیار حرفهای است.
این هوش مصنوعی بسیار قدرتمند است؛ چراکه میتواند متنی با توصیفات پیچیده و انتزاعی را درک و براساس آن، تصویر تولید کند.
مزایای استیبل دیفیوژن نسبت به سایر مدلهای مشابه
مدل Stable Diffusion مانند دیگر مدلهای ساخت تصویر، از جمله میدجرنی، یکسری مزایا و فواید ویژه دارد، که آن را تبدیل به یک انتخاب برتر کرده است.
- یکی از مزایای قابل توجه Stable Diffusion منبع باز بودن آن است. منبع باز یا اوپن سورس بودن (open source) به این معنی است که معماری مدل، کد و ابزارهای مرتبط آن برای همه در دسترس است. بنابراین همه چیز برای کاربرانش شفاف است.
- مزیت دیگر این هوش مصنوعی، این است که شما میتوانید از آن روی سایتهای آنلاین استفاده کنید و نیازی به نصب یک برنامه سنگین پرحجم نیست.
- همچنین استیبل دیفیوژن رایگان است!
- در نهایت شاید بتوان مهمترین مزیت این هوش مصنوعی قدرتمند را، رعایت حریم خصوصی کاربران ذکر کرد. طبق ادعای وبسایت استیبل دیفیوژن، آنها هیچ اطلاعات و دادهای از کاربرانش را جمع نمیکنند؛ حتی از ورودیهای کاربران برای آموزش مدل خود استفاده نمیکنند.
کاربردهای استیبل دیفیوژن چیست؟
کار با مدلهای هوش مصنوعی هنری لذت بخش و جالب است، اما غیر از جنبه سرگرمی، استیبل دیفیوژن کاربردهای فراوان دیگری هم دارد که بسیار حرفهای و تخصصی است. در ادامه چند مورد را برایتان لیست کردهایم:
- ساخت عکس با درخواست متنی
- ساخت عکس از روی یک عکس دیگر
- ادیت و ویرایش یک عکس
- حذف یا اضافه کردن جزییات تصویر
- ساخت انواع تصاویر در سبکهای هنری مختلف
- تبدیل یک اسکچ به یک تصویر رئال (واقعگرایانه)
- ادغام چهره یک شخص با تصویر مورد نظر
- استفاده در مارکتینگ و تبلیغات
- استفاده در معماری و گرافیک
آیا Stable Diffusion رایگان است؟
همانطور که گفتیم Stable Diffusion منبع باز و رایگان است. شما میتوانید در وبسایت رسمی Stable Diffusion به رایگان در عرض چند ثانیه عکس بسازید!
با این وجود، بستههای اشتراک ماهانه برای دولوپرها و دیگر افرادی که به دنبال ویژگیهای پیشرفته و قابلیتهای بیشتر این ابزار هستند، در دسترس است.
نحوه استفاده از هوش مصنوعی Stable Diffusion
شما میتوانید برنامه استیبل دیفیوژن را روی سیستم عامل خود نصب کنید و یا در وبسایت رسمیاش از این هوش مصنوعی استفاده کنید.
روش اول: نصب استیبل دیفیوژن
نصب آن سخت است و نیاز به یک سیستم عامل بسیار قدرتمند دارد. (ویندوز ۱۰ به بالا، Nvidia GPU RTX با حداقل 12 گیگابایت VRAM و فضای ذخیره سازی روی هارد دیسک بالای ۱۰ گیگ). سپس باید Git و Miniconda3 را نصب کنید، فایل های استیبل دیفیوژن را از GitHub بگیرید و محیط پایتون مخصوصش را بسازید.
در نهاین چک پوینتهای مورد نظرتان را از HuggingFace.co دانلود کنید و در پوشه استیبل دیفیوژن قرار دهید. حالا میتوانید عکس های دلخواهتان را بسازید!
روش دوم: استفاده از وبسایت به صورت رایگان
راه دیگر این است که خیلی راحت به وبسایت اصلی استیبل دیفیوژن مراجعه کنید و تصاویر خود را بسازید!
قدم اول: به سایت استیبل دیفیوژن بروید.
قدم دوم: پیام متنی خود را در قسمت txt2img وارد کنید.
قدم سوم: روی دکمه «generate» کلیک کنید و عکس خود را تحویل بگیرید!
اگر تصویر با چیزی که میخواستید مطابقت نداشت، اشکالی ندارد. می توانید توضیحات خود را تغییر دهید یا ابزارها را تنظیم کنید و مراحل را دوباره تکرار کنید.
چند ترفند برای استفاده از استیبل دیفیوژن:
بازسازی چهره
با وجود همه تواناییهای استیبل دیفیوژن، اما این هوش مصنوعی در ساخت چهره خیلی خوب عمل نمیکند. مثلا صورت افراد را بدفرم یا بهم ریخته میسازد. راه حل این مشکل این است که از یک مدل هوش مصنوعی دیگر برای رفع این ایرادات استفاده کنید.
البته گاهی اوقات با استفاده از inpainting این ایراد برطرف میشود.
2-رفع اشکالات کوچک با inpainting
اینپینتگ یا همان inpainting یک راه حل خوب برای برطرف کردن ایرادات تصاویر ساخته شده با استیبل دیفیوژن است. وقتی استیبل دیفیوژن به شما تصویری را تحویل داد و از آن راضی نبودید، کافی است که پرامپت خود را اصلاح کنید و دوباره بنویسید.
3-چاپ تصاویر بزرگ
تصاویر خروجی استیبل دیفیوژن عموما ۵۱۲*۵۱۲ پیکسل هستند، البته تصاویر ورژن ۱ و ۱.۵، رزولوشین متفاوتی دارند. برای چاپ تصاویر بزرگ از این ابعاد استفاده کنید:
تصویر منظره: نسبت ابعاد ۲:۳
تصویر پرتره: نسبت ابعاد ۳:۲
آشنایی با ابزارهای مختلف استیبل دیفیوژن
استیبل دیفیوژن به عنوان یک هوش مصنوعی ساخت تصویر، از پارامترها و ابزارهای مختلفی استفاده میکند تا کیفیت تصاویرش را بالا ببرد.
Seed
ابزار Seed یک عدد است که رنگ و نورپردازی تصویر را تنظیم میکند. شما با بالا و پایین کردن این عدد میتوانید رنگ و نور تصویر خود را تغییر دهید.
Upscaler
استیبل دیفیوژن میتواند از شما تصویر دریافت کند تا از روی آن برایتان تصویر تولید کند، اما اگر کیفیت تصویر شما پایین باشد، چه؟! خب استیبل دیفیوژن با استفاده از ابزار Upscaler کیفیت و رزولوشن تصاویر ورودی را بالا میبرد.
Sampling Steps
ابزار Sampling Steps همانطور که از اسمش پیداست به مراحل ساخت عکس اشاره دارد. هوش مصنوعی استیبل دیفیوژن در یک مرحله تصویر شما را نمیسازد، بلکه طی چندین مرحله عکس درخواستی را تولید میکند و هربار آن را بهبود میبخشد تا به شما تحویل دهد. و عددی که Sampling Steps نشان میدهد، نشان دهنده تعداد این مراحل است.
CFG scale
Classifier Free Guidance scale یا همان CFG در استیبل دیفیوژن ابزاری است که خلاقیت یا پایبندی به پرامپت استیبل دیفیوژن را مشخص میکند. به عبارت دیگر هرچه عدد CFG بالاتر باشد یعنی آزادی استیبل دیفیوژن محدودتر است و باید به پرامپتی که گرفته پایبند باشد.
استیبل دیفیوژن در یک پاراگراف
در این مقاله نامبرلند مفصل درباره هوش مصنوعی تصویرساز Stable Diffusion صحبت کردیم و توضیح دادیم که این هوش مصنوعی با چه ابزارهایی کار میکند، چه کاربردهایی دارد و چطور میتوان به رایگان بهترین تصویرها را با استیبل دیفیوژن ساخت.
Stable Diffusion یک هوش مصنوعی پیشرفته و قدرتمند ساخت تصویر است که میتواند از شما دستور متنی بگیرد یا حتی یک عکس بگیرد و براساس آن، تصویر دیگری تولید کند.
برای اینکه دقیقا تصویر موردنظر خودتان را دریافت کنید، باید دقیق، واضح و مشخص خواسته خود را ذکر کنید. مثال درست: «یک گربه سفید از نژاد پرشین که زیر نور آفتاب دراز کشیده برایم بساز.»
مثال غلط: «یک گربه بساز»
بله، Stable Diffusion در حال حاضر به صورت رایگان هم از طریق وب و هم از طریق نصب بر روی دیوایس شما قابل دسترسی است.
Stable Diffusion در اصل برای تولید و ویرایش تصویر طراحی شده است. با این حال، می توان آن را برای ویرایش ویدیو با پردازش فریم های جداگانه به صورت متوالی استفاده کرد.
استیبل دیفیوژن تصاویر بسیار باکیفیت و واقع گرایانه تولید میکند و در درک پرامپت کاربران بسیار دقیق است.
Stable Diffusion را می توان برای سازگاری با سیستم عامل های مختلف از جمله Windows، macOS و Linux قابل توسعه است.
خیلی راحت از وب سایت رسمی Stable Diffusion Online دیدن کنید. این پلتفرم رابط کاربری سادهای دارد و کافی است یک پرامپت واضح بنویسید، عکس تحویل بگیرید!