Илья Рогов: "Дата-центры все чаще применяют технологии машинного обучения. Уже сейчас они помогают обеспечить бесперебойную работу систем, предотвратить перерасход потребления мощностей"
Илья Рогов,
директор по маркетингу дата-центра Xelent
© ComNews
21.12.2018

Рынок дата-центров показывает стабильный рост последние годы. По данным Uptime Institute за 2017 год, количество ЦОДов в мире увеличивается благодаря растущему спросу на хранение и обработку все более значительных объемов данных. Повышение спроса на услуги ЦОД обуславливает потребность совершенствовать технологические процессы и искать пути повышения производительности, и дата-центры находят для этого все новые средства. Разбираем, какие основные тренды заметны на рынке ЦОД.

Тренд 1. Дата-центры становятся гипермасштабными

ГиперЦОД – это центры, имеющие емкость в десятки и сотни тысяч стоек. Их работа требует огромных энерго-мощностей. Они занимают тысячи или даже миллионы квадратных метров.

Но не это главное. Во-первых, их отличает способность к масштабированию. ГиперЦОД имеют большие ресурсы для наращивания мощностей. Во-вторых, в сравнении с обычными ЦОД, потребление энергии в расчете на 1 стойку гораздо ниже. В-третьих, гиперЦОД отличает высокий уровень автоматизации процессов, поэтому они задействуют гораздо меньше персонала — в основном это сотрудники службы безопасности.

Один из наиболее примечательных сверхмасштабных дата-центров — ЦОД Facebook, который компания строит в Сингапуре и планирует сдать в эксплуатацию к 2020 году. По данным Datacenterknowledge, строящееся 11-этажное здание ЦОД будет занимать 1,8 миллиона квадратных метров площади. Это будет гиперЦОД с возможностью наращивания мощностей до 150 МВт, что примерно совпадает с совокупным объемом всех сингапурских дата-центров Amazon Web Services, Microsoft Azure и Google Cloud.

Вместе с размерами ЦОД растет уровень автоматизации и обеспечения безопасности. Для заказчиков это означает расширение возможностей: они могут создавать и настраивать гибкую инфраструктуру и наращивать мощности почти до бесконечности.

В 2017 году агентство Synergy Research Group провело исследование гипермасштабных дата-центров. На конец прошлого года их во всем мире существовало почти 400. Их создание и обслуживание обеспечивали в основном 24 компании, на которые в среднем приходилось по 16 ЦОД. При этом компаниям-гигантам Amazon, Google, IBM и Microsoft принадлежало по 40-50 дата-центров, таким образом, на них приходится почти половина всех гиперЦОД.

Тенденция роста количества сверхмасштабных ЦОД сохраняется. Synergy Research Group считает, что к концу 2019 их будет около 500. Тренд создания гиперЦОДов особенно заметен среди американских компаний. В России пока иначе — у нас рост спроса на хранение и обработку данных обеспечивается за счет строительства новых дата-центров или масштабирования модульных ЦОДов, таких как Xelent.

Тренд 2. Жидкостное охлаждение все чаще дополняет воздушное

По подсчетам исследователей Миюру Даярахна, Йонганга Вэна и Руя Фэна, в 2016 году 50% потребляемой дата-центрами энергии требовалось на обеспечение охлаждающей инфраструктуры. Жидкостное охлаждение может существенно снизить эти расходы.

Идея охлаждать сервера не воздухом, а водой, не нова. Такой способ был популярен в 80-е и 90-е годы прошлого века. Однако из-за риска порчи оборудования повсеместным он не стал: в случае утечки воды из системы вероятность серьезного ущерба крайне высока.

Современные системы имеют более совершенное строение: вода отделена от ИТ-оборудования прослойкой специальной жидкости. Например, существуют системы с прямым чипом, которые используют диэлектрические негорючие жидкости со стандартными модулями охлаждения. Благодаря этим модулям, вода соприкасается лишь с теплообменником, который обеспечивает работу системы. Он забирает тепло из диэлектрической жидкости, которая является прослойкой между оборудованием и водой, и передает ей холод от воды.

Например, Google разработала способ жидкостного охлаждения на воздушной подушке. Это замкнутая система, которая состоит из двух контуров охлаждения: циркулирующей непроводящей жидкости и обычной охлаждаемой воды. Диэлектрическая жидкость соприкасается с теплоотводами TPU, нагревается и переносит тепло в теплообменник. Здесь оно передается в контур охлажденной воды. Она нагревается, и возвращается к охлаждающей установке. После чего тепло выходит в пространство дата-центра.

При воздушном охлаждении увеличить количество стоек непросто: нужно докупать дополнительное оборудование для охлаждения из расчета динамики воздушного потока. В случае использования жидкостного охлаждения можно просто увеличить мощность охлаждающей системы. Это актуально, когда дата-центры сильно загружены.

Пока большинство коммерческих дата-центров используют воздушное охлаждение, но уже сегодня понятно, что у жидкостного хорошие перспективы развития в ближайшие 10 лет.

Тренд 3. Передача данных в сетях существенно ускоряется

По данным Uptime Institute, 70 % сбоев дата-центров связано с ошибками конфигурации сети и зачастую происходят по вине человека. Автоматизация снижает влияние человеческого фактора, а установка более современного оборудования или модификация старого позволяет значительно ускорить работу сетей.

Автоматизированные средства позволяют быстро изменять конфигурацию сети.  При увеличении пропускной способности сетей плановые задачи, которые потребовали бы недель для решения, могут быть закрыты за считанные минуты. Это позволяет значительно увеличить пропускную способность сети и сохранить или сократить расходы на энергопотребление.

Например, ИТ-инженеры Facebook еще пять лет назад решили уделить внимание развитию сетей передачи данных из-за того, что в соответствии с законом Мура процессоры работали слишком медленно.  Увеличение объема данных было предсказуемым, поэтому компания своевременно озаботилась развитием сетей.

Менее десяти лет назад сети центров обработки данных использовали около 1 Гб интернет-соединений из серверной. Сейчас цифры иные – до 100 Гб, а ближайшем будущем Facebook планирует увеличить объемы до 400 Гб. Это огромный рост пропускной способности. На сегодняшний день развитие сетей обработки данных превзошло развитие любых других компонентов ЦОД. По расчетам ИТ-специалистов компании, это обеспечит хорошее масштабирование сети в ближайшие десять лет.

Тренд 4. Machine Learning становится частью ЦОД

Дата-центры все чаще применяют технологии машинного обучения. Уже сейчас они помогают обеспечить бесперебойную работу систем, предотвратить перерасход потребления мощностей.

Машинное обучение применяется при разработке решений, когда нужно подобрать оптимальный способ охлаждения, рассчитать необходимое количество оборудования и спрогнозировать потребление мощностей. Это дает возможность контролировать и прогнозировать энергопотребление, делать расчеты по увеличению мощностей в случае необходимости. Такие решения собирают и анализируют данные, посылают их на оборудование ЦОД. Затем на основании полученных данных нагрузка на питание для каждой стойки рассчитывается и распределяется в соответствии с ее потребностями. Также модель машинного обучения может использоваться в качестве эмулятора, чтобы понять, как повлияет подача питания, если добавить больше серверов или стоек.

Решения, основанные на машинном обучении, можно настроить на анализ температуры и влажности, потребляемых мощностей и других данных. Они работают быстрее, чем сотрудники ЦОД, способны быстрее выявить аномалии в работе оборудования дата-центра и даже их спрогнозировать.

Машинное обучение помогает трансформировать управление центром обработки данных с помощью обнаружения аномалий, моделирования и прогнозирования программных сбоев на основании статистических данных. Также технологии машинного обучения помогают провести анализ инцидентов, определить причины сбоев или других возможных проблем производительности.

Машинное обучение повышает доступность и отказоустойчивость дата-центров. Например, встраивание технологий машинного обучения в программное обеспечение позволяет операторам дата-центров прогнозировать и предотвращать сбои в работе оборудования.

Более того, многие дата-центры развивают свои системы мониторинга на базе машинного обучения и продают их как продукт. Другие создают мониторинг на базе ML и используют его, как конкурентное преимущество. Например, в Xelent работает уникальное сочетание многоступенчатого параллельного контроля: данные с датчиков поступают в режиме 24/7 на пульты поставщиков систем охлаждения, энергоснабжения и других систем, которые параллельно отслеживают работу своих систем.

Хотя использование машинного обучения в управлении центрами обработки данных не является новинкой, в последнее время ускорилась тенденция роста популярности машинного обучения применительно к работе с данными и облаками. По данным исследования Uptime Institute, ожидается, что тренд использования машинного обучения сохранится, и к 2019 году Machine learning будут использовать большинство ЦОД.

Что дальше

Итак, дата-центры наращивают мощности и оптимизируют энергопотребление. Но есть и другие тренды, менее глобальные. Например, в связи с высокой производительностью тепловой энергии встает вопрос о ее утилизации или дальнейшем использовании. В финском дата-центре "Яндекса" высвобождаемая тепловая энергия обеспечивает нагрев воды и отопление в жилых домах для 20 000 человек города Мянтсяля. Таким образом, одновременно решается две задачи: утилизируется тепловая энергия, а дата-центр получает дополнительный доход. В целом же будущее – за дальнейшей оптимизацией уже используемых дата-центрами технологий, ростом уровня автоматизации и появлением совсем новых форматов, например, мобильных подводных дата-центров.