© ComNews
24.07.2018

"Аэрофлот" использует отечественную СУБД Tarantool для работы с большими данными при аналитике клиентских обращений.

В конце 2017 года "Аэрофлот" развернул уникальную платформу по работе с обращениями клиентов. Компания стала первой в транспортной отрасли, кто внедрил для этого алгоритмы предиктивной аналитики больших данных. В качестве СУБД была использована отечественная разработка – решение Tarantool от компании Mail.Ru Group. Проект выполнила компания "Интегро Текнолоджиз", входящая в ГК "РАМАКС".

Платформа по работе с обращениями – это комплекс систем и единый центр доступа к индивидуальным клиентским данным для оказания персонального сервиса, регистрации, маршрутизации и обработки клиентских обращений. Основная цель комплекса – повысить лояльность клиентов с помощью качественного SMM.

Комплекс состоит из большого количества модулей, которые покрывают как функциональные бизнес-требования, так и модули интеграции в существующую IT- инфраструктуру ПАО "Аэрофлот" и различные каналы поступления обращений (социальные сети, e-mail, официальный сайт, личный кабинет).

Первый модуль системы занимается процессом идентификации клиента на основе комплексного анализа данных, как самого текста (в том числе, комментариев), так и открытых данных профиля автора (ФИО, e-mail, телефон и т.п.). Объём обрабатываемых данных из различных источников равен нескольким тысячам обращений в день.

Второй модуль отвечает за поиск дублей обращений. Нередко пользователи копируют текст и публикуют его на различных ресурсах, в том числе, направляют по электронной почте. Семантически похожие посты важно определять для выявления кластеров, которые являются инцидентами. Обработка сразу нескольких постов существенно сокращает загрузку ответственных сотрудников.

Третий модуль "Инфоповоды" в режиме реального времени занимается анализом потока текстовых данных (публикаций, комментариев). Происходит семантический анализ постов, построение связей слов и групп слов (n-грамм) с последующим наложением на временной ряд, а также поиск и агрегация инфоповодов. Алгоритм призван показывать пики активности в социальных сетях или ее рост, что может указывать на потенциальную "инфо-бомбу". Одна из уникальных возможностей данного модуля - предиктивно выявлять опасные посты еще до того, как начнется рост активности.

Объем данных, необходимый для перечисленных модулей системы, выходит за пределы привычного лимита локального хранения в приложении. Расчетное количество обращений к данным равнялось нескольким тысячам запросов в секунду с необходимым откликом в пару миллисекунд. Сложности разработке добавили такие требования, как, например, прописанное ограничение времени в три секунды на обогащение обращения различными свойствами.

Проведя анализ существующих БД на рынке, клиент остановил выбор на СУБД Tarantool по ряду критериев: предоставление полноценного окружения и набора инструментов для реализации ресурсоемкой вычислительной логики в самой БД; поддержка равноценности серверов и сбалансированное распределение данных для обеспечения высокого уровня отказоустойчивости и оптимального использования серверного оборудования; использование механизма компактного хранения данных в памяти; низкие аппаратные требования и другие.

Производительность Tarantool в ряде тестов была на несколько процентов выше, чем у конкурентов, а компактность хранения практически на всех типах данных обгоняет конкурентов еще на несколько процентов. Одним из ключевых пожеланий заказчика было использование отечественного ПО.

Tarantool используется в платформе как оперативная БД, в которой обращения хранятся в виде специальных структур данных, необходимых для алгоритмов аналитики. Высокая производительность и наличие в базе таких свойств, как вторичные индексы и поддержка большого количество соединений без потери производительности, позволило успешно реализовать вышеописанные функциональные модули, не выходя за поставленные временные рамки.

По результатам внедрения заказчик с помощью платформы значительно увеличил эффективность процесса обработки жалоб и обращений клиентов сотрудниками "Аэрофлота", кардинально сократил время доставки обращения и время на обработку/решение вопроса за счет механизмов обогащения обращения контекстом, тональностью, тематиками (тегирование), профилем автора и т.п. Всё это нацелено на достижение положительного экономического и репутационного эффекта практически на всех этапах предоставления услуг ПАО "Аэрофлот". На основе успешного опыта все участники проекта продолжат использовать ПО Tarantool в своих проектах.

"Использование отечественных разработок в такой крупной компании, как "Аэрофлот", сегодня крайне важно. Сегодня российский софт не часто ни в чем не уступает, а, как в нашем случае, и превосходит иностранные аналоги. Именно поэтому и был выбран Tarantool. И, естественно, выполняется важный фактор импортозамещения, что для нашей компании является одним из ключевых приоритетов на ближайшие годы", - сообщил директор по информационным технологиям ПАО "Аэрофлот" Кирилл Богданов.