Алексей Любимов: "Уже в ближайшее время "голос" должен стать одной из ключевых технологий цифровой экономики".
Алексей Любимов,
председатель совета директоров Консорциума 3i Technologies
© ComNews
26.02.2018

Помните клип группы "Ленинград", в котором таксист из Закавказья не может правильно продиктовать адрес – улица Рубинштейна, 24. Так вот это даже на момент появления клипа не соответствовало действительности. Системы распознавания речи, построенные на нейросетях, в наборе звуков вроде "рублиштейнадвасатьшетыре" вполне точно выявляют содержание запроса. За минувшие десять лет голосовые технологии мощно эволюционировали, и теперь они вполне созрели для того, чтобы стать частью цифровой экономики.

Надо сказать, что массовый пользователь уже успел привыкнуть к речевым интерфейсам. Люди ни один год "голосом" задают адрес автомобильному навигатору, общаются с Siri и Google Assistant (а некоторые даже пользуются Amazon Alexa), взаимодействуют с голосовыми чатботами при заказе по телефону и т. д. И тем не менее речевое управление все еще экзотика. В то же время, уже в ближайшее время "голос" должен стать одной из ключевых технологий цифровой экономики.

Например, голосовыми чатботами уже обзавелись или обзаводятся банки, операторы связи, страховые компании и т. п. На очереди медицина и ЖКХ. Для операторов или банков использование чатботов, в том числе голосовых – это возможность снизить расходы за счет сокращения персонала контакт-центров и автоматизации технической поддержки первого уровня. Для медицины и ЖКХ голосовые чатботы – это создание качественных услуг, ведь сегодня дозвониться до поликлиники или управляющей компании зачастую непросто. Использование же голосовых чатботов позволит не только фиксировать все обращения, сортировать их на ранней стадии, отсекая телефонный спам, но и в автоматическом режиме производить запись на прием к врачу или отправлять бригаду скорой помощи.

Причем, автоматизация и повсеместное внедрение чатботов, в том числе голосовых, – это не прихоть отечественных чиновников, а сложившийся мировой тренд. К примеру, эксперты американской консалтинговой компании Merritt Hawkins посчитали, что только из-за того, что пациенты не могут дозвониться, чтобы отменить или перенести визит к врачу, медицинская индустрия США теряет ежегодно до $150 млрд. Причем, перед североамериканской медициной стоит задача объединить более 250 тыс. приложений, уже созданных медучреждениями и ведомствами, на базе единой платформы интегрированной с глобальными системами, такими как Apple Siri, Amazon Alexa и Google Assistant. Медицинская служба Великобритании также переходит от почтовых уведомлений и телефонных звонков к мобильным приложениям, в том числе с использованием речевых интерфейсов.

Кроме того, голосовые технологии могут использоваться для повышения качества обслуживания. Собственно, банки или операторы связи, запуская очередную рекламную компанию, пытаются контролировать качество работы подрядчиков или подразделений, записывая и выборочно анализируя материал. Интеллектуальная система может в режиме реального времени следить за соблюдением "сценариев" сотрудниками. Подобными системами уже заинтересовался крупный отечественный ритейл. Так, специалисты Консорциума 3i Technologies разработали решение для автоматизированного анализа диалогов между сотрудниками и клиентами в розничных торговых точках 3i TouchPoint Analytics. Решение построено на базе нейросетей и, если его соответствующим образом обучить, то оно может применяться не только в розничной торговле.

Некоторые отраслевые эксперты связывают резкий рост спроса на "голосовые" технологии с массовым внедрением систем дополненной и виртуальной реальности (AR/VR). Однако, перспективы AR/VR туманны, так как они еще очень незрелые. В то же время, речевые технологии уже вполне оформились и прошли "обкатку", в том числе у массового потребителя. Очевидно, что "голос" - наиболее комфортный интерфейс для взаимодействия с целым рядом систем. Например, управлять умным домом точно удобнее, отдавая речевые команды, нежели с сенсорной панели или экрана смартфона. Голосовые системы способны принимать и обрабатывать заказы по телефону на доставку еды или товаров в интернет-магазинах. Речевые технологии – это возможность автоматизировать такие процессы, которые еще недавно автоматизации не подлежали, и вывести на принципиально новый уровень сервиса целые направления экономики, которые долгое время были в числе "отстающих".