شب گذشته به وقت ایران یکی دیگر از کنفرانس های جنجالی کمپانی OpenAI بود. علاوه بر رایگان شدن فروشگاه GPT و معرفی هوش مصنوعی GPT-4o، یکی دیگر از اخباری که در حاشیه مراسم دیشب کمپانی OpenAI منتشر شد، عرضه قابلیت دستیار صوتی است که از فیلم Her الهام گرفته شده است. این دستیار صوتی می تواند حالات چهره را بخواند و به صورت زنده زبان گفتاری را ترجمه کند.
ورج گفته: امیدواریم که این دستیار صوتی وظایفش را به خوبی انجام دهد و مثل فیلم Her کاربر را رها نکند!
معرفی قابلیت های دستیار صوتی
موراتی مدیر فنی OpenAI در کنار دیگر مهندسان در این کنفرانس از قابلیتهای دیگر این دستیار صوتی رونمایی کردند. آن ها از دستیار خواستند که یک قصه قبل از خواب برایشان تعریف کند، سپس به طور ناگهانی از او خواستند که صدایش را به صدای رباتیک تغییر دهد، و در نهایت از دستیار خواستند که همان داستان را با صدای آواز به پایان برساند.
سپس از دستیار خواسته شد به آنچه دوربین تلفن میبیند نگاه کند و درباره چیزهایی که روی صفحه نمایش دیده میشود صحبت کند. نکته جالب اینکه این دستیار صوتی توانایی این را داشت که در حین صحبت کردن قطع شود و بدون اینکه دوباره صدایش کنند، خودش صحبت را ادامه دهد.
افشا گری در مورد دستیار صوتی OpenAI
موراتی یک جلسه توجیهی با The Verge داشته و اشاره کرده که دستیار صوتی به شکلی ساخته نشده که مثل جوهانسون صدا داشته باشید و تاکید هم کرد که OpenAI از پیش این صداها را داشته.
میرا موراتی اشاره کرد که یکی از حاضران در جلسه در مورد صدای دستیار هوش مصنوعی پرسیده و گفته که نتوانسته صدای دستیار را از ChatGPT تشخیص دهد. در ادامه او اشاره به شخصیت و تنوع صدای زیاد این دستیار کرده است و گفته صدا به قدری منحصر بهفرد بوده که نتوانسته آن را از صداهایی که قبلا در ChatGPT شنیده، تشخیص دهد.
تفاوت قابلیت جدید با نسخه فعلی دستیار صوتی
این ویژگی های جدید نسبت به حالت صوتی فعلی ChatGPT یک ارتقا محسوب می شود؛ چرا که نسخه فعلی نمی تواند هنگام صحبت قطع شود و یا به دوربین نگاه کند و سوالات را پاسخ دهد. قابلیت نسخه جدید که تا هفته آینده رونمایی می شود، ابتدا برای مشترکین ChatGPT Plus در دسترس خواهد بود.
سم آلتمن در یک پست وبلاگی که بعد از پخش زنده منتشر شد گفت: حالت جدید صدا بهترین رابط کامپیوتری است که تا کنون استفاده کرده ام. احساس می کنم مانند هوش مصنوعی در فیلمهاست و هنوز باورم نمیشود که واقعی باشد! همچنین در ادامه گفت: «دستیابی به زمان های پاسخگویی و بیاناتی در سطح انسان، تغییر بزرگی را به همراه دارد.»
به نظر شما هوش مصنوعی تا چه حد می تواند در این زمینه پیش برود؟