سالهاست که افراد دچار مشکلات بینایی از برنامههای جانبی برای خواندن محتوای صفحه نمایش گوشی بهره میبرند ولی بازهم تجربه خوب و راحتی از کار با گوشی موبایل ندارند. گوگل چند ماه پیش هوش مصنوعی Gemini را به اندروید اضافه کرد تا افراد نابینا یا کمبینا بتوانند توصیف دقیقتری از تصاویر روی گوشی دریافت کنند؛ اما حالا یک لایه کاملا جدید از تعامل را به این قابلیت اضافه کرده است تا کار با گوشی برای این افراد بسیار راحتتر شود. تا پیش از این، Gemini فقط تصاویر را توصیف میکرد؛ ولی اکنون کاربران میتوانند درباره عکسها سؤال بپرسند و یک مکالمه تعاملی و جزئیتر داشته باشند.
هوش مصنوعی Gemini به کمک نابینایان میآید
گوگل میگوید حالا نهتنها هوش مصنوعی Gemini تصاویر را برایتان توصیف کند، بلکه شما میتوانید درباره برند، رنگ یا حتی اشیای دیگر موجود در عکس سؤال بپرسید و جمینای هم به سوالات شما پاسخ میدهد.
کاربر میتواند بپرسد: «کدام لباس برای یک شب سرد زمستانی مناسبتر است؟» یا مثلا «چه سسی برای این ساندویچ بهتر است؟» و Gemini میتواند کل محتوای صفحه را تحلیل کند، اطلاعات جزئیتری از محصولات بدهد و تخفیفهای موجود را اطلاع دهد.
زیرنویسهای احساسی و بهبود بزرگنمایی متن
به نقل از digitaltrends، البته گوگل ناشنوایان یا کمشنوایان را هم فراموش نکرده است. گوگل در مرورگر کروم، زیرنویسهای خودکار ویدیوها را بهبود داده است؛ مثلا اگر در حال تماشای یک مسابقه فوتبال باشید، زیرنویسها دیگر فقط کلمات مفسر را نشان نمیدهند، بلکه لحن و احساس او را هم منتقل میکنند.
برای مثال، بهجای نوشتن «goal»، حالا عبارت احساسیتری مثل «گـــــــل!» نمایش داده میشود. گوگل این نوع زیرنویسها را زیرنویسهای احساسی (Expressive Captions) نامیده است.
علاوهبر سخن گفتن افراد، این زیرنویسها حالا صداهای مهم دیگر مثل سوت، تشویق یا حتی صافکردن گلو را هم پوشش میدهند. این قابلیت برای همه دستگاههایی که اندروید ۱۵ یا نسخههای جدیدتر را اجرا میکنند، در کشورهای آمریکا، بریتانیا، کانادا و استرالیا در دسترس خواهد بود.
ویژگی کاربردی دیگر در کروم، «بزرگنمایی تطبیقی متن» است که نسخه پیشرفتهتری از قابلیت Page Zoom در اندروید محسوب میشود. حالا زمانی که کاربر اندازه متن را بزرگ میکند، سایر اجزای صفحه بههم نمیریزد و ساختار کلی صفحه حفظ میشود.
نظر شما درباره این قابلیتها چیست؟