Запускаем Gemini 3.1 Flash Live: новый аудиомодель от Google

1 просмотров Источник
Запускаем Gemini 3.1 Flash Live: новый аудиомодель от Google

Google представил свою новейшую аудиомодель Gemini 3.1 Flash Live, которая обещает сделать взаимодействие с голосовыми системами более естественным и надежным. Эта модель обеспечивает улучшенную точность и меньшую задержку, что делает голосовые взаимодействия более плавными и точными.

Gemini 3.1 Flash Live — это высококачественная аудиомодель, разработанная для реального времени. Разработчики могут получить к ней доступ через API Gemini Live в Google AI Studio, а предприятия могут использовать её для улучшения клиентского опыта. Пользователи по всему миру могут попробовать её в Search Live и Gemini Live, которые теперь поддерживают более 200 стран.

Модель демонстрирует значительные улучшения в понимании тональности, что позволяет создавать более естественные диалоги. Она также позволяет разработчикам создавать голосовых агентов, способных выполнять сложные задачи более надежно. На бенчмарке ComplexFuncBench Audio модель продемонстрировала лучший результат, чем ее предшественник.

Gemini 3.1 Flash Live также улучшила распознавание акустических нюансов, таких как высота и темп, что делает взаимодействие более интуитивным. Компании, такие как Verizon и The Home Depot, уже отметили положительное влияние модели на свои рабочие процессы.

С запуском Gemini 3.1 Flash Live пользователи теперь могут вести многоязычные разговоры в реальном времени, что открывает новые возможности для коммуникации. Все аудиофайлы, созданные с помощью этой модели, имеют водяной знак SynthID, что помогает предотвратить распространение дезинформации.

Похожие статьи