Google запустил офлайн-приложение для диктовки с ИИ
В понедельник Google тихо выпустил офлайн-приложение для диктовки под названием «Google AI Edge Eloquent» для iOS, чтобы конкурировать с такими приложениями, как Wispr Flow, SuperWhisper и Willow. Приложение доступно для бесплатной загрузки, и после загрузки моделей автоматического распознавания речи на основе Gemma вы можете начать диктовку на своем телефоне. В приложении вы можете видеть живую транскрипцию, а когда нажимаете на паузу, приложение автоматически удаляет заполнительные слова, такие как «эм» и «ах», и очищает текст.
Под транскрипцией находятся опции, такие как «Ключевые моменты», «Формально», «Коротко» и «Долго», для преобразования текста. Вы также можете отключить облачный режим, чтобы использовать только локальную обработку. Когда облачный режим включен, приложение использует облачные модели Gemini для очистки текста. Google AI Edge Eloquent может импортировать определенные ключевые слова, имена и терминологию из вашей учетной записи Gmail, если это необходимо. Кроме того, вы можете добавить свои собственные пользовательские слова в список.
Приложение отображает историю сеанса транскрипции и позволяет искать по всем ним. Оно может показать вам слова, диктованные в последнем сеансе, вашу скорость речи в словах в минуту и общее количество произнесенных слов. «Google AI Edge Eloquent — это продвинутое приложение для диктовки, созданное для того, чтобы сократить разрыв между естественной речью и профессиональным текстом, готовым к использованию. В отличие от стандартного программного обеспечения для диктовки, которое транскрибирует запинки и заполнительные слова, Eloquent использует ИИ для захвата вашего намерения. Оно автоматически редактирует 'эм', 'ах' и самокоррекции в середине предложения, выдавая чистый и точный текст», — говорится в описании приложения в App Store.
Хотя приложение в настоящее время доступно только на iOS, в описании App Store упоминается версия для Android. Мы связались с Google для получения дополнительной информации и обновим статью, если получим ответ. Согласно описанию, Eloquent предлагает «бесшовную интеграцию с Android», где его можно установить в качестве клавиатуры по умолчанию для системного доступа ко всем текстовым полям. Кроме того, приложение сможет использовать функцию плавающей кнопки, аналогичную той, что используется в Wispr Flow на Android, для легкого доступа к транскрипции отовсюду.
Приложения для транскрипции на основе ИИ становятся все более популярными среди пользователей по мере улучшения моделей распознавания речи. С этим экспериментальным приложением Google присоединяется к тренду. Если этот тест будет успешным, мы можем увидеть улучшенные функции транскрипции и на Android.
Создайте AI-агентов для адаптации сотрудников с Amazon Quick
Запускаем NVIDIA Transformer Engine с смешанной точностью и бенчмаркингом
Похожие статьи
UCSD и Together AI представляют Parcae: стабильную архитектуру для языковых моделей
UCSD и Together AI представили Parcae, новую архитектуру языковых моделей с улучшенной эффективностью.
DeepL запускает перевод голоса для встреч и разговоров
DeepL представила новый продукт для перевода голоса, охватывающий различные сценарии общения.
Создание многоагентных систем ИИ с помощью SmolAgents и динамической оркестрации
Создание многоагентных систем ИИ с использованием SmolAgents и динамической оркестрации.