هوش مصنوعی Gemini به کمک افراد کم‌بینایان و کم‌شنوایان می‌آید

سال‌هاست که افراد دچار مشکلات بینایی از برنامه‌های جانبی برای خواندن محتوای صفحه نمایش گوشی بهره می‌برند ولی بازهم تجربه خوب و راحتی از کار با گوشی موبایل ندارند. گوگل چند ماه پیش هوش مصنوعی Gemini را به اندروید اضافه کرد تا افراد نابینا یا کم‌بینا بتوانند توصیف دقیق‌تری از تصاویر روی گوشی دریافت کنند؛ اما حالا یک لایه کاملا جدید از تعامل را به این قابلیت اضافه کرده است تا کار با گوشی برای این افراد بسیار راحت‌تر شود. تا پیش از این، Gemini فقط تصاویر را توصیف می‌کرد؛ ولی اکنون کاربران می‌توانند درباره عکس‌ها سؤال بپرسند و یک مکالمه تعاملی و جزئی‌تر داشته باشند.

هوش مصنوعی Gemini به کمک نابینایان می‌آید

گوگل می‌گوید حالا نه‌تنها هوش مصنوعی Gemini تصاویر را برایتان توصیف کند، بلکه شما می‌توانید درباره برند، رنگ یا حتی اشیای دیگر موجود در عکس سؤال بپرسید و جمینای هم به سوالات شما پاسخ می‌دهد.

کاربر می‌تواند بپرسد: «کدام لباس برای یک شب سرد زمستانی مناسب‌تر است؟» یا مثلا «چه سسی برای این ساندویچ بهتر است؟» و Gemini می‌تواند کل محتوای صفحه را تحلیل کند، اطلاعات جزئی‌تری از محصولات بدهد و تخفیف‌های موجود را اطلاع دهد.

زیرنویس‌های احساسی و بهبود بزرگ‌نمایی متن

به نقل از digitaltrends، البته گوگل ناشنوایان یا کم‌شنوایان را هم فراموش نکرده است. گوگل در مرورگر کروم، زیرنویس‌های خودکار ویدیوها را بهبود داده است؛‌ مثلا اگر در حال تماشای یک مسابقه فوتبال باشید، زیرنویس‌ها دیگر فقط کلمات مفسر را نشان نمی‌دهند، بلکه لحن و احساس او را هم منتقل می‌کنند.

برای مثال، به‌جای نوشتن «goal»، حالا عبارت احساسی‌تری مثل «گـــــــل!» نمایش داده می‌شود. گوگل این نوع زیرنویس‌ها را زیرنویس‌های احساسی (Expressive Captions) نامیده است.

علاوه‌بر سخن گفتن افراد، این زیرنویس‌ها حالا صداهای مهم دیگر مثل سوت، تشویق یا حتی صاف‌کردن گلو را هم پوشش می‌دهند. این قابلیت برای همه دستگاه‌هایی که اندروید ۱۵ یا نسخه‌های جدیدتر را اجرا می‌کنند، در کشورهای آمریکا، بریتانیا، کانادا و استرالیا در دسترس خواهد بود.

ویژگی کاربردی دیگر در کروم، «بزرگ‌نمایی تطبیقی متن» است که نسخه پیشرفته‌تری از قابلیت Page Zoom در اندروید محسوب می‌شود. حالا زمانی که کاربر اندازه متن را بزرگ می‌کند، سایر اجزای صفحه به‌هم نمی‌ریزد و ساختار کلی صفحه حفظ می‌شود.

نظر شما درباره این قابلیت‌ها چیست؟

هوش مصنوعی Gemini وب‌گردی را برای افراد دارای مشکلات بینایی و شنوایی آسان‌تر می‌کند

هوش مصنوعی Gemini به کمک نابینایان می‌آید

زیرنویس‌های احساسی و بهبود بزرگ‌نمایی متن

کوثر غلامی

دیدگاهتان را بنویسید لغو پاسخ

هوش مصنوعی Gemini به کمک نابینایان می‌آید

زیرنویس‌های احساسی و بهبود بزرگ‌نمایی متن

اشتراک گذاری مطلب:

کوثر غلامی

شرکت OpenAI از ابزار Codex برای انجام وظایف مهندسی نرم‌افزار رونمایی کرد

هوش مصنوعی AlphaEvolve معرفی شد: ابزاری برای خلق الگوریتم‌های انقلابی در برنامه‌نویسی

دیدگاهتان را بنویسید لغو پاسخ