© ComNews
20.09.2019

Эксперты 3i Technologies разработали новый движок распознавания речи 3i ASR 2.0, который позволит улучшить качество работы продуктов и сервисов компании. Благодаря 3i ASR 2.0 системы смогут точнее понимать живую человеческую речь.

Новый движок построен на базе end-to-end архитектуры с использованием нейросетей и машинного обучения (machine learning). 3i ASR 2.0 обучен на выборке в несколько тысяч часов с аугментацией данных (внесением разных типов искажений). Это позволило значительно снизить уровень относительной ошибки и повысить качество распознавания живой речи.

Вычислительная инфраструктура реализована с ускорением на GPU, что позволяет получать многократный прирост производительности относительно CPU. Новый движок дает возможность распознавать массивы речевой информации в более чем сто раз быстрее их реального звучания.

"Технологии распознавания речи и системы, созданные с их использованием, меняют привычные сервисы. Все уже сталкивались с тем, что речевую систему можно встретить в контакт-центре, позвонив в техподдержку. Нас прекрасно понимают электронные устройства, когда мы голосом диктуем, например, поисковый запрос. Продукты 3i Technologies контролируют диалоги сотрудников транспортных компаний с клиентами, или общение работников ритейла. По "голосу" мы выявляем телефонных мошенников. B c каждым днем сфера применения речевых технологии расширяется, при этом заказчики становятся все более требовательными к качеству распознавания и скорости обработки речевой информации. И новый движок – это ощутимый шаг вперед", - говорит председатель совета директоров 3i Technologies Алексей Любимов.

Движок 3i ASR 2.0 будет использоваться как в новых продуктах, так и в тех, которые уже внедрены. Например, он будет интегрирован в облачный сервис для профессиональной обработки речевых данных 3i Speech Recognition, в облачную платформу речевой аналитики 3i Touchpoint Analytics и другие продукты и сервисы компании. Миграция на новый движок произойдет бесшовно.