...

Ученые из Казахстана создали модель, способную распознавать речь на 10 тюркских языках

Поделиться статьей:
Содержание статьи

Группа ученых из ISSAI в Казахстане представила новую технологию способную распознавать речь на 10 различных тюркских языках. Модель успешно справляется с распознаванием азербайджанского, башкирского, чувашского, казахского, киргизского, саха, татарского, турецкого, уйгурского и узбекского языков.

В ходе исследования было обнаружено, что многоязычные модели, обученные с использованием данных, содержащих смешанную речь, показывали более надежные результаты по сравнению с базовыми одноязычными моделями. Лучшая модель достигла снижения частоты ошибок в символах на 56% и в словах на 54%.

В рамках исследования был также представлен корпус турецкой речи с открытым исходным кодом. Этот корпус содержит 218,2 часа расшифрованной речи, включающей 186 171 высказывание, и является крупнейшим общедоступным набором данных на турецком языке. Наборы данных и коды, используемые для обучения моделей, доступны для загрузки на следующем ресурсе: https://github.com/IS2AI/TurkicASR.

Для демонстрации практической пользы многоязычной модели автоматического распознавания речи для тюркских языков ISSAI разработала демонстрационную программу, которая способна распознавать десять тюркских языков, а также русский и английский языки.

Поделиться статьей:
Подобранные статьи специально для вас
Новости

Платформа Voiceflow увеличила свою стоимость на 50% после привлечения инвестиций на ИИ

Компания Voiceflow привлекла 15$ млн, что привело к увеличению ее оценки на 50%. Полученные средства будут направлены на разработку генеративного ИИ Builder, который будет использоваться

Новости

Руководители и обычные сотрудники расходятся в мнениях о внедрении ИИ

Рядовые сотрудники американских компаний с восторгом воспринимают новые технологии, но утверждают, что руководство не проявляет достаточного интереса и замедляет внедрение. Это может привести к упущению