Cloud.ru запустил Evolution Stack.ML для обучения моделей в частном и гибридном облаке
Cloud.ru объявил о запуске в коммерческую эксплуатацию Evolution Stack.ML — платформы для распределенного обучения ИИ-моделей и разработки ИИ-приложений в частном и гибридном облаке. Теперь крупный бизнес и государственные компании могут работать с ИИ, используя собственные вычислительные мощности, а при необходимости масштабироваться в публичное облако. Evolution Stack.ML обеспечивает полный контроль над данными и соответствие требованиям регуляторов по безопасности.
В основе платформы лежит сервис Evolution Distributed Train — это инструмент для обучения и тюнинга моделей машинного обучения, их ускоренного развертывания и совместной работы команд дата-сайентистов. Платформа объединяет инструменты для разработки, управления экспериментами и мониторинга в единую экосистему.
В Evolution Stack.ML пользователи могут запускать изолированные рабочие пространства для более чем 200 команд одновременно. Механизмы очередей, приоритетов, аллокаций и спотов позволяют оптимально распределять нагрузку между задачами, достигая высокого уровня утилизации GPU-инфраструктуры и снижая стоимость ее эксплуатации. Платформа позволяет добиться роста утилизации GPU с 35% до 90%, позволяя окупить расходы на серверные мощности менее чем за 3 месяца. Совместное использование кластеров позволяет нарастить скорость обучения и разработки новых ИИ-решений на 20%.
Встроенные механизмы восстановления (self-healing) автоматически обнаруживают сбои оборудования, перезапускают задачи и заменяют GPU-ноды, обеспечивая стабильное выполнение распределенных задач обучения даже на больших кластерах. OSS слой в составе облачной платформы Cloud.ruпозволяет отслеживать загрузку инфраструктуры и контролировать расходы.
Решение открывает возможности применения ИИ в компаниях с самыми высокими требованиями к безопасности — компаниями из государственного и финансового секторов, операторами ЦОДов, промышленными предприятиями. Инфраструктура отвечает требованиям регуляторов к обработке и хранению персональных и финансовых данных, а также размещению ГИС и КИИ.
"Evolution Stack.ML помогает преодолеть барьеры для внедрения ИИ в крупном бизнесе и государственных компаниях — решение соответствует строгим требованиям к безопасности и нормам регуляторов. Evolution Stack.ML повышает экономическую эффективность использования собственного "железа" и при этом дает доступ к самым современным технологиям и методам работы с ИИ", — сказал Михаил Лобоцкий, генеральный директор Cloud.ru.
Исследование Cloud.ru показало, что в России растет спрос со стороны бизнеса на гибридные сценарии. Среди наиболее востребованных сценариев — задачи, связанные с обработкой данных и использованием ИИ, разработка и тестирование в облаке, а также георезервирование и disaster recovery. В этих случаях гибрид позволяет сочетать контроль над критической инфраструктурой с гибкостью облачных ресурсов.
