...

Google не останавливается в создании языковых моделей

Поделиться статьей:
Содержание статьи

Исследование, проведенное специалистами из Google, показало, что применение большой языковой модели в модели генерации звука значительно улучшает результаты распознавания речи и перевода.

На основе этой работы была создана AudioPaLM — новый инструмент, объединяющий модель генерации звука AudioLM и ведущую языковую модель Google PaLM-2. Эта система предназначена для работы с большими объемами текстовых материалов.

Новая модель AudioPaLM превосходит такие модели, как Whisper Large-v2 от OpenAI, mSLAM-CTC 2B и собственную USM-M от Google. AudioPaLM можно использовать в различных задачах, связанных с преобразованием речи в текст. Она может выполнять перевод для языков, которые не были частью ее обучения, только на основе короткой речевой подсказки.

Поделиться статьей:
Подобранные статьи специально для вас
Новости

Платформа Voiceflow увеличила свою стоимость на 50% после привлечения инвестиций на ИИ

Компания Voiceflow привлекла 15$ млн, что привело к увеличению ее оценки на 50%. Полученные средства будут направлены на разработку генеративного ИИ Builder, который будет использоваться

Новости

Руководители и обычные сотрудники расходятся в мнениях о внедрении ИИ

Рядовые сотрудники американских компаний с восторгом воспринимают новые технологии, но утверждают, что руководство не проявляет достаточного интереса и замедляет внедрение. Это может привести к упущению