Skip links
Навигация

Google не останавливается в создании языковых моделей

Исследование, проведенное специалистами из Google, показало, что применение большой языковой модели в модели генерации звука значительно улучшает результаты распознавания речи и перевода.

AudioPaLM

На основе этой работы была создана AudioPaLM — новый инструмент, объединяющий модель генерации звука AudioLM и ведущую языковую модель Google PaLM-2. Эта система предназначена для работы с большими объемами текстовых материалов.

Новая модель AudioPaLM превосходит такие модели, как Whisper Large-v2 от OpenAI, mSLAM-CTC 2B и собственную USM-M от Google. AudioPaLM можно использовать в различных задачах, связанных с преобразованием речи в текст. Она может выполнять перевод для языков, которые не были частью ее обучения, только на основе короткой речевой подсказки.

Поделиться:

Свежие публикации

Голосовой робот в качестве помощника – замена современных сервисов

Голосовой робот-ассистент — это программа, которая использует голосовой интерфейс для взаимодействия с пользователем и предоставления услуг. Робот-ассистент может выполнять такие
Этот веб-сайт использует файлы cookie для улучшения вашего веб-опыта.