Skip links
Навигация

Google не останавливается в создании языковых моделей

Исследование, проведенное специалистами из Google, показало, что применение большой языковой модели в модели генерации звука значительно улучшает результаты распознавания речи и перевода.

AudioPaLM

На основе этой работы была создана AudioPaLM — новый инструмент, объединяющий модель генерации звука AudioLM и ведущую языковую модель Google PaLM-2. Эта система предназначена для работы с большими объемами текстовых материалов.

Новая модель AudioPaLM превосходит такие модели, как Whisper Large-v2 от OpenAI, mSLAM-CTC 2B и собственную USM-M от Google. AudioPaLM можно использовать в различных задачах, связанных с преобразованием речи в текст. Она может выполнять перевод для языков, которые не были частью ее обучения, только на основе короткой речевой подсказки.

Поделиться:

Свежие публикации

Что должен уметь современный голосовой бот? Спойлер: не только отвечать на вопросы

В предыдущих статьях мы уже рассказывали про сферы использования голосового бота и описывали его преимущества. Но что реально должен уметь
Этот веб-сайт использует файлы cookie для улучшения вашего веб-опыта.