Модель распознает речь на любую тему и в разных форматах: короткие и длинные фразы, а также имена, адреса, даты и числа. Она умеет распознавать язык автоматически в одном потоке: нейросеть может в любой момент переключаться между языками. При этом есть возможность давать ей «подсказки», чтобы улучшить качество распознавания.

С помощью нейросети компании смогут проще и быстрее создавать многоязычных голосовых помощников и мультиязычных голосовых роботов для колл-центров с большим потоком клиентов, говорится в пресс-релизе компании.

Нейросеть работает на базе архитектуры Transformer — обрабатывает вводные слова параллельно и независимо друг от друга, поэтому быстро обучается. Кроме того, языковую модель обучали на массивах данных из сервисов и приложений «Яндекса» для того, чтобы при переходе на другой язык качество текста оставалось связным и грамматически верным.

Нейросеть-полиглот доступна для пользователей Yandex SpeechKit и настраивается стандартными средствами в API.