اواسط تابستان امسال بود که گوگل قابلیت Gemini live را به جهان معرفی کرد. این قابلیت یک دستیار صوتی بر پایه هوش مصنوعی جمینای است که از ابتدا قرار بود با حالت صوتی هوش مصنوعی GPT4-o (یعنی قابلیت Voice mode) رقابت کند.

البته در روزهای اول معرفی، این قابلیت فقط در دسترس کاربران Gemini advanced قرار داشت. اما حالا به نقل از verge این قابلیت به صورت رایگان برای همه کاربران عرضه شده است.

از حالا می‌توانید هر سوالی دارید از Gemini Live بپرسید و او هم جواب شما را به حالت شفاهی بیان می‌کند. شما حتی می‌توانید حرفش را در حین صحبت کردن قطع کنید! درست مثل یک انسان!

قابلیت Gemini Live دقیقا چیست؟

این ویژگی مشابه همان حالت صوتی چت جی‌پی‌تی یا سیری است،‌ یعنی شما با هوش مصنوعی صحبت می‌کنید و او (در حقیقت هوش مصنوعی Gemini) به شما جواب می‌دهد و تمام مکالمات هم بسیار روان و طبیعی خواهد بود. مثلا کاربران می‌توانند وسط حرف او بپرند، مکالمه را قطع کنند یا ادامه دهند.

این دستیار چندین صدا به شما ارائه می‌دهد و حتی توانایی تقلید صدای شما در لحظه را دارد! جالبترین نکته درباره قابلیت Gemini Live این است که می‌توانید مکالمه را حتی زمانی که تلفنتان قفل است یا در حال کاری هستید ادامه دهید.

دسترسی به قابلیت Gemini Live و عملکرد آن

در حال حاضر، قابلیت Gemini Live فقط به زبان انگلیسی و فقط روی دستگاه‌های اندرویدی در دسترس است، اما زبان‌های بیشتر و پشتیبانی از iOS در راه است.

هنوز نمیدانیم که قابلیت Gemini Live چه عملکردی از خودش نشان دهد اما دستیار صوتی GPT4-o با جنجال و هیاهوی زیادی روبرو شد. چنین قابلیتی اگرچه نوآورانه است، اما خیلی هم نتوانست خوب کار کند و نگرانی‌هایی در مورد وابستگی عاطفی به هوش مصنوعی را برانگیخت.

در دیگر اخبار مربوط به دنیای هوش مصنوعی،‌ دیدیم که OpenAI از مدل‌های مرموز و متفکر هوش مصنوعی o1 و o1-mini رونمایی کرده است!