© ComNews
30.03.2018

Основатель Telegram Павел Дуров сообщил о намерении модернизировать оборудование для надежности работы мессенджера. Заявление прозвучало вчера после того, как у Telegram произошел масштабный сбой, по причине которого мессенджер был недоступен для пользователей в России, ряде стран Европы, а также Ближнего Востока и СНГ. В общей сложности мессенджер не был доступен около четырех часов. Эксперты считают, что Telegram из-за разового перерыва не понесет серьезных убытков.

Вчера, с 11 часов дня по Москве, Telegram был недоступен для пользователей в России, ряде стран Европы, а также Ближнего Востока и СНГ. Об этом сообщалось в официальном Twitter-аккаунте мессенджера.

Роскомнадзор, который уже давно ведет переговоры с руководством Telegram Messenger Ltd. о необходимости исполнения обязанностей организатора распространения информации (мессенджер должен предоставить органам безопасности (ФСБ России) информацию, требуемую для декодирования сообщений), через пару часов сообщил через свой Twitter-аккаунт о непричастности к сбою работы Telegram в России. "Пользователи сегодня жалуются на сбой работы Telegram. По данным СМИ, больше всего жалоб поступает из России, Италии, Испании, Франции, Великобритании, Украины и Казахстана. Если вам не терпится заподозрить во всем РКН, знайте - мы тут ни при чем", - сообщило ведомство в Twitter.

Позднее представители Telegram указали в Twitter причину сбоя: "Проблемы в Европе вызвало отключение питания в кластере серверов. Со своей стороны мы работаем над устранением этой проблемы, однако много зависит от того, когда провайдер центра обработки данных починит оборудование". В Роскомнадзоре не прошли мимо этого сообщения и отметили, что "Россия входит в топ стран с самым дешевым электричеством". "Отечественные бензиновые генераторы не уступают импортным аналогам. Локализуйте данные на территории России, обеспечьте бесперебойную работу своей компании", - сообщили представители регулятора в Twitter.

В разговоре с корреспондентом ComNews технический директор сети дата-центров компании "Крок" (ЗАО "КРОК инкорпорейтед") Павел Горюнов отметил, что сбои в энергоснабжении возможны даже в дата-центрах уровня Tier 3 и выше, сертифицированных по стандартам непрерывности Uptime Institute. Но это скорее исключения, носящие характер форс-мажора. В целом периодичность возможных сбоев или отказов в работе центра обработки данных (ЦОД) зависит от уровня резервирования компонентов инженерной инфраструктуры дата-центра и его оснащенности.

Специалист "Крока" подчеркнул, что случай с Telegram - пример сбоя, которые случаются крайне редко - не более одного раза в два-три года. "Например, ЦОД "Компрессор", входящий в сеть дата-центров "Крока", работает без остановки более шести лет и обеспечивает стабильную работу инфраструктуры крупнейших российских и международных ретейлеров, банков, промышленных и FMCG-компаний", - добавил Павел Горюнов.

Говоря о том, как можно избежать таких сбоев, он сказал, что основной вопрос стоит в наличии плана Disaster Recovery и резервных ЦОДов, на которые можно переключить нагрузку при возникновении сбоя. "Для мессенджеров и пользовательских сервисов наиболее оптимальна схема резервирования из трех и более резервных площадок. Такой подход поможет обеспечить доступность бизнес-приложений и сервисов для конечных пользователей и быстро восстановить их работоспособность даже при полном выходе из строя одной из них", - пояснил Павел Горюнов.

Кроме того, добавил он, альтернативным решением при Disaster Recovery для высоконагруженных сервисов может быть создание резервной площадки в облаке, когда ее ресурсы подключаются только в случае сбоя. "В первую очередь, услуги по непрерывности бизнеса и DR необходимы ИТ-зависимым бизнесам - банкам, финансовым организациям, онлайн-ретейлерам и пользовательским цифровым сервисам", - уточнил технический директор сети дата-центров "Крока" .

По словам Павла Горюнова, в случае если не принимать меры к устранению подобных рисков, то аналогичные инциденты могут возникать снова. "Поэтому мы всегда рекомендуем заказчикам проводить регулярные аудиты ИТ-инфраструктуры, разрабатывать и отрабатывать DR-планы, имитируя сбои не реже двух раз в год", - резюмировал он.

Руководитель облачного провайдера "Техносерв Cloud" Никита Дергилев обратил внимание на то, что у любого ЦОДа, даже уровня Tier3, может случиться авария, которая приведет к перерыву в сервисе. "Обычно возможность такого перерыва указывается в SLA. Хорошей практикой для любого провайдера сервиса, использующего мощности ЦОДа, является резервирование инфраструктуры на физическом уровне - разнесение систем по двум или трем площадкам, расположенным в разных местах города, разных регионах или даже странах. Тем более если речь идет о таком массовом сервисе, как Telegram", - рассказал Никита Дергилев корреспонденту ComNews.

Например, добавил он, причина падения мессенджера могла бы быть не только в энергетике ЦОДа, но и в каналах связи. "Уверен, что Telegram серьезно работает над резервированием, но, видимо, где-то была допущена техническая ошибка - неправильно рассчитана нагрузка или неверно задана конфигурация, в результате коллеги не были готовы к массовому отключению питания: при падении одного из ЦОДов произошло заметное проседание сервиса. Это вопрос к организации SaaS-услуги в целом, а не только к питанию в ЦОДе", - прокомментировал эксперт.

Никита Дергилев отметил, что "Техносерв Cloud" в обязательном порядке резервирует инфраструктуру, предоставленную для бизнес-задач заказчиков, чтобы исключить возможность остановки сервиса при аварии в ЦОДе или на каналах связи.

Полностью устранить проблему Telegram Messenger Ltd удалось к 15:00 (по Москве). Сначала мессенджер заработал в Европе и на Ближнем Востоке, а немного позднее - в Германии и СНГ. В общей сложности Telegram не был доступен около четырех часов.

"Чтобы убедиться, что такие сбои больше не повторятся, мы установили прямую связь в режиме реального времени между нашими инженерами и электриками центров обработки данных и, что более важно, начали модернизировать наше оборудование, связанное с электропитанием", - сообщил основатель мессенджера Павел Дуров в своем Telegram-канале. Кроме того, основатель сервиса принес извинения за сбои в работе мессенджера, а также поблагодарил пользователей за поддержку и терпение.

За эти три часа, пока не работал Telegram, пользователи начали уходить в другие мессенджеры. Так, например, пользователи Yota (ООО "Скартел", 100%-ная "дочка" ПАО "МегаФон") - в WhatsApp. Клиенты мобильного оператора, которые активно пользуются Telegram, сменили мессенджер в связи со сбоем в его работе. Об этом корреспонденту ComNews сообщила пресс-служба Yota.

По данным аналитиков мобильного оператора, 80% процентов пользователей Telegram в момент начала сбоя перешли на WhatsApp. Оставшиеся 20% распределились между Skype и Viber примерно в равной пропорции. При этом сбой практически никак не повлиял на Facebook Messenger. Кроме того, добавили в Yota, увеличение нагрузки на WhatsApp, Skype и Viber было равномерным в течение всего периода сбоя. "После восстановления работы Telegram 90% его аудитории вернулось обратно в мессенджер", - констатировали в компании.

В пресс-службе ПАО "МегаФон" рассказали, что значительное снижение трафика Telegram в сети оператора в Московском регионе было зафиксировано после 11:00. "С этого момента объем передачи данных сократился в 20 раз, но в то же время не показывал нулевого объема. Вероятнее всего, это связано с тем, что, например, сообщения фиксировались в мессенджере как отправленные, но не были получены адресатом", - сказали в компании.

В "МегаФоне" не зафиксировали значительных изменений по голосовым вызовам или SMS. "Аналитика технического контроля сети показала, что нагрузку принял на себя в основном WhatsApp. С 12:00 объем передачи данных в данном мессенджере начал расти и показал значения, превышающие обычные дни, практически в полтора раза выше привычных. Остальные мессенджеры изменений не показали", - прокомментировал технический директор столичного "МегаФона" Евгений Новоселов.

По словам аналитика ГК "Финам" Леонида Делицына, такие сбои могут совершенно по-разному отразиться на репутации мессенджеров. "Если бы речь шла о рынке, на котором присутствует несколько практически неотличимых игроков, оказывающих приблизительно одинаковые услуги и ведущих ценовые войны, чтобы отбирать клиентов от конкурентов, если клиент судит по соотношению цена/качество, то сбой - фатален. Если мессенджер используется для делового общения, то сбой может вести к потере клиентов", - отметил аналитик.

При этом он добавил, что если мессенджер используется как платежная система - а крупнейшие мессенджеры намерены в скорейшем времени стать платежными системами, - то сбой негативно повлияет и на финансы, и на репутацию. "Однако пока мессенджер позиционируется как уникальный, предлагающий услугу, которую конкуренты предоставить не могут, работает бесплатно и пользуется горячей любовью своих пользователей, то сбой на их лояльности практически не отразится. Скорее они помянут в социальных сетях недобрым словом всех реальных и гипотетических врагов своего любимца", - заметил Леонид Делицын.

Никита Дергилев считает, что Telegram из-за разового перерыва не понесет каких-то серьезных убытков. "Но если бы подобная ситуация произошла с провайдером бизнес-сервиса, то это был бы весомый удар, в первую очередь по репутации. Вопрос даже не в штрафах, а именно в потере репутации. Такие проблемы приводят к оттоку заказчиков", - заключил он.

Статьи по теме