گوگل ابزار هوش مصنوعی ساخت عکس Nano Banana Pro را در اپلیکیشن جمینای قرار داد. تمرکز نسخه‌ی جدید نانو بنانا بر تولید عکس‌هایی استودیویی واقع‌گرایانه، با وضوح 4K و نسبت‌ ابعاد متنوع است.

Soundcloud

جدیدترین اخبار تکنولوژی هوش مصنوعی و شبکه‌های اجتماعی را در نامبرلند بخوانید.

با خرید اکانت gemini و دسترسی به نسخه پرو، امکان استفاده از هوش مصنوعی نانو بنانا 2 را در وب و اپلیکیشن جمینای خواهید داشت.

طبق اعلام گوگل، نانو بنانا پرو به کاربران امکان می‌دهد تصاویر خروجی را با حداکثر ‌وضوح 4K و با نسبت‌ ابعاد مختلف (شامل 16:9 و 9:16) تولید کنند، موضوعی که برای کاربردهایی مثل پست‌ شبکه‌های اجتماعی، پوستر یا طراحی اسلاید‌ بسیار مناسب خواهد بود.

ویژگی‌های هوش مصنوعی نانو بنانا 2

  • تولید متن روی تصویر: نانو بنانا 2 در زمینه‌ی نوشتن متن در عکس عملکرد بسیار بهتری از مدل قبلی دارد. این مدل، متن‌های کوتاه یا پاراگراف‌ها را به زبان‌های مختلف و با فونت و بافت متنوع تولید می‌کند. چنین قابلیتی برای طراحی پوسترها، منوها، دعوت‌نامه‌ها و اینفوگرافیک‌ها اهمیت دارد.
اینفوگرافی با نانو بنانا
پرامپت: یک اینفوگرافیک عریض با عنوان «انرژی خورشیدی چگونه کار می‌کند» طراحی کن؛ با سبک فلت و تمیز. شامل: آیکون خورشید، نمودار پنل خورشیدی، فلش‌هایی که جریان انرژی را به سمت خانه و باتری نشان می‌دهند، چهار مرحله شماره‌گذاری‌شده همراه با کپشن‌های کوتاه و یک نمودار میله‌ای مقایسه‌ای برای «مصرف در روز در برابر شب». نسبت تصویر 16:9 باشد.
  • ترکیب و ویرایش چند تصویر همزمان: کاربر می‌تواند حداکثر 6 تصویر آپلود و آن‌ها را با هم ترکیب کند یا سبک آن‌ها را تغییر دهد (Style Transfer). علاوه‌بر این، ویرایش حرفه‌ای تصویر مانند تغییر زاویه‌ی دوربین، نورپردازی، زوم در عکس، تبدیل روز به شب، تنظیم نسبت تصویر و موارد دیگر با نانو بنانا پرو امکان‌پذیر شده است.
پرامپت: نمایی سینمایی و واید از استانبول در زمان طلایی. در پیش‌زمینه، طرح‌های پیچیده کاشی‌کاری عثمانی روی نرده‌ی یک بالکن با فوکوس واضح دیده می‌شود. در پس‌زمینه، ایاصوفیه و مسجد آبی بر فراز بوسفر در افق قرار گرفته‌اند و در برابر غروب گرم، مه‌آلود و نارنجی‌ـ‌بنفش به‌صورت سیلوئت دیده می‌شوند. مرغ‌های دریایی در دوردست در حال پروازند. فوتورئالیستیک، رزولوشن 8K. —نسبت تصویر 2:1
  • راهنمایی روی بوم (on-canvas guidance): اکنون در نانو بنانا 2، کاربر می‌تواند اصلاح مورد نظر را با کشیدن دایره روی تصویر مشخص کند تا جمینای متوجه شود که کدام بخش باید تغییر یابد و سپس تغییرات را اعمال کند.
پرامپت: یک اینفوگرافیک نقشهٔ حرفه‌ای و با وضوح بالا از اروپا. نقشه باید توپوگرافیک باشد و رشته‌کوه‌ها را به‌صورت برجسته نمایش دهد. برچسب‌های متنی واضح و تیز نام پایتخت‌های مهم را مشخص کنند: «Paris»، «Berlin»، «Rome»، «Madrid» و «Warsaw». رنگ اقیانوس آبی ماتِ تیره باشد و خشکی‌ها در تُن‌های طبیعی زمین نمایش داده شوند. تایپوگرافی تمیز و مدرن، مناسب یک کتاب درسی. —نسبت تصویر 4:3

مثال‌های ارائه‌شده شامل درخواست‌هایی مثل «ایجاد پوستر اینفوگرافیک چگونگی کارکرد انرژی خورشیدی» با طرحی مسطح و نسبت 16:9، یا «تصویری ایزومتریک سه‌بعدی از اکوسیستم خانه هوشمند» با رنگ‌های پاستلی، یا پوستر سفری با استایل Art Deco برای «مریخ» هستند.

نسخه‌ی هوش مصنوعی نانو بنانا 2 نسبت‌به مدل قبلی Nano Banana چند تفاوت اساسی دارد. امکاناتی چون کنترل نسبت ابعاد، ترکیب چند تصویر و نوشتن متن روی عکس با کیفیت بالا در یک جریان کاری واحد، بدون نیاز به ابزارهای جداگانه اضافه شده است. این موضوع موجب کاهش نیاز به نرم‌افزارهای جانبی و همخوانی بهتر خروجی‌ها با نیازهای کانال‌های مختلف می‌شود.

پرامپت: یک شات محصول حرفه‌ای در استودیو از یک ساعت هوشمند آینده‌نگر و شفاف که روی یک قطعه سنگ اسلیت تیره قرار گرفته است. رابط ساعت با درخشش هولوگرافیک سبز می‌تابد. نورپردازی نرم و دراماتیک، رزولوشن 8K، سبک عکاسی ماکرو با عمق میدان کم. —نسبت تصویر 4:3

کاربران برای استفاده از نانو بنانا 2 باید در اپلیکیشن Gemini، مدل Thinking را انتخاب کنند تا قابلیت جدید فعال شود. کاربران رایگان سهمیه‌ی محدودی دارند، اما مشترکین مدل‌های پلاس، پرو و Ultra سهمیه‌ی بیشتری دریافت می‌کنند. ابزار جدید نانو بنانا پرو برای توسعه‌دهندگان و سازمان‌ها از طریق API جمینای و ‎Google AI Studio و ‎Vertex AI قابل استفاده است.

با اضافه شدن نانو بنانا پرو به جمینای، کاربران ابزار قدرتمندتری برای تولید محتوا در اختیار خواهند داشت. از کنترل دقیق نسبت ابعاد برای شبکه‌های اجتماعی تا تولید اینفوگرافیک‌ها و ترکیب چند تصویر با هم.

گوگل برای تشخیص عکس ساخته‌شده با AI در نانو بنانا پرو، دو مکانیزم تشخیص را قرار داده است. فناوری ‎SynthID یک واترمارک ناپیدا در عکس‌ها قرار می‌دهد و یک واترمارک قابل دیدن برای کاربران رایگان و پرو، تا تشخیص دهد تصویر از هوش مصنوعی گوگل تولید شده است. کاربران Ultra ممکن است این واترمارک قابل‌دیدن را نداشته باشند تا برای کاربردهای حرفه‌ای مناسب‌تر باشد.

قابلیت ایجاد عکس و ویدیو در elevenlabs، قابلیت جدید این پلتفرم محبوب تولید صدا با هوش مصنوعی است.