Алексей Любимов: "Понятно, что речевые интерфейсы не в один год станут бизнес-стандартом. И, вроде как, мы еще не успели привыкнуть к текстовым чат-ботам, а им на смену уже идут голосовые"
Алексей Любимов,
председатель совета директоров Консорциума 3i Technologies
© ComNews
13.08.2018

Для речевых технологий 2018 год стал, наверно, одним из самых удачных. Произошло три знаковых события, по мере значимости: с 30 июля был запущен государственный проект создания системы удаленной идентификации пользователей, 6 августа голосовой помощник Google Assistant заговорил по-русски, а 29 мая стартовали продажи "умной" колонки от "Яндекса".

Важнее прочих событий, конечно, запуск "удаленной идентификации", точнее не сам проект, потому как он с технологической точки зрения сырой, а изменения в законодательство, которые были разработаны специально под него. В результате голосовая биометрия получила официальный статус. Дело в том, что и до этого банки собирали базы "голосов", записывая переговоры клиентов с сотрудниками. В финансовых организациях в результате скапливались сотни или даже тысячи часов разговора, хранение которых с одной стороны было не совсем законно, а с другой не имело практической пользы, так как к этим базам организации обращались только в случае возникновения конфликтных ситуаций.

Инициатором создания Единой биометрической системы и внедрения удаленной идентификации выступила банковская отрасль. Финансовые организации, желая упростить для себя условия выдачи кредитов и предоставления других банковских продуктов, разработали изменения в законодательство. В перспективе, используя дистанционную идентификацию, со смартфона можно будет не только получить кредит, но и воспользоваться, например, госуслугами, медицинскими сервисами. Пока голосовые технологии госсервисы используют чаще всего для контроля качества работы сотрудников. Наша платформа 3i Touchpoint Analytics, анализирующая диалоги сотрудников с клиентами на предмет выполнения "скриптов" и соблюдения норм общения внедряется в ритейле, госсекторе, сфере услуг и т. д. Удаленная же идентификация по нескольким биометрикам, одна из которых – "голос", позволит в будущем совершенно отказаться от использования бумажных удостоверяющих документов и перейти к бездокументарной модели.

Пока внедрение удаленной идентификации продвигается вяло: россияне не спешат сдавать образцы голосов банкам. Начавшиеся изменения законодательной базы, безусловно, дадут толчок рынку речевых технологий, и как только единую биометрическую систему разрешат использовать за пределами банковской отрасли, спрос на "голос" заметно вырастет. Все-таки кредиты – не тот продукт, ради которого захотелось бы сдать биометрию. Совсем другое дело, если "лицо-голос" можно будет использовать вместо паспорта и водительского удостоверения, при аренде автомобиля, заселении в гостиницу, вместо денег в магазине или театре. С точки зрения пользователя удаленная идентификация – это один из атрибутов наступающей цифровой экономики.

Два других значимых события 2018 года для рынка речевых технологий – появление русскоговорящего Google Assistant и умной колонки "Яндекса" – можно связать воедино. Для разработчиков - это появление устойчивого спроса на голосовые интерфейсы. До недавнего времени подобные заказы были штучными, большинство российских компаний не чувствовали необходимости в речевых технологиях. Теперь же появились новые каналы продаж, попасть в которые без "голоса" просто невозможно. Сейчас это напоминает рынок интернет-продаж десятилетней давности, когда интернет-магазины были скорее экзотикой, нежели реальным бизнесом. Однако прошло не так много времени и все изменилось.

Понятно, что речевые интерфейсы не в один год станут бизнес-стандартом. И, вроде как, мы еще не успели привыкнуть к текстовым чат-ботам, а им на смену уже идут голосовые. Тем не менее, мы видим, как растет спрос на разработку навыков под голосового помощника от "Яндекса" – "Алису", а ведь она была запущена только в мае. Думаю, уже к концу года проявится практический интерес к приложениям под Google Assistant, который присутствует в куда большем количестве девайсов (смартфонов, планшетов и умных колонок). В конце концов, если можно заказать голосом пиццу или букет цветов, то хорошо бы, чтоб можно было аналогично надиктовать "роботу" пакет продуктов для доставки из "Перекрестка" или "Утконоса", и чтобы система могла сообщить, если чего-то нет, предложить заменить отсутствующее чем-то другим.

Подводя итоги можно сказать, что 2018 год для рынка речевых технологий стал переломным. Долгие годы разработчики "голосовых" сервисов пребывали словно в ожидании. Системы уже давно достигли технологической зрелости, однако рынок не спешил их внедрять. И вот теперь, "запрос" на речевые технологии пришел практически одновременно и от государства, и от рынка. То есть. созданы все условия для бурного роста "голоса".