Яндекс.Облако открывает доступ к новому сервису для разработчиков машинного обучения Yandex DataSphere

28.05.2020

Платформа Яндекс.Облако открывает доступ к новому сервису Yandex DataSphere для разработки машинного обучения. Сервис работает в режиме preview, доступ предоставляется по предварительной регистрации. Пользоваться Yandex DataSphere можно бесплатно.

Yandex DataSphere — это облачная среда для использования инструментов машинного обучения. Разработчикам предлагается привычный интерфейс Jupyter Notebook, одного из наиболее популярных инструментов ML-разработки. При этом возможности Jupyter Notebook адаптированы к работе в облаке и существенно расширены.

В закрытом тестировании Yandex DataSphere приняли участие 19 российских компаний, активно применяющих машинное обучение в бизнесе, и 31 индивидуальный разработчик. По мнению экспертов, новый сервис позволяет экономить до 70% ресурсов на вычисления с применением GPU.

Впервые в практике публичных облаков Yandex DatаSphere использует технологию бессерверных вычислений (serverless computing) при работе с машинным обучением. Это значит, что при редактировании и просмотре кода не задействуются вычислительные ресурсы CPU или GPU. Виртуальная машина нужного типа подключается только для непосредственных расчётов: обучение моделей, запуск, другие вычисления. При таком подходе клиент платит только за время реального использования вычислительных ресурсов. Редактирование и просмотр кода, случайный простой не выключенной ночью или на выходных виртуальной машины не тарифицируется.

Также впервые в мире в Yandex DataSphere реализовано бесшовное переключение между разными типами вычислительных ресурсов. В Yandex DatаSphere можно без остановки вычислений и с сохранением прогресса применять разные типы виртуальных машин: экономичные с CPU (обычные процессоры) и быстрые с GPU (графические ускорители). В большинстве облачных сред разработки машинного обучения запустить расчёты модели возможно только на машине одного типа. Если часть вычислений требует использования более дорогой машины с GPU, на ней будет вычисляться весь проект. В Yandex DatаSphere каждая часть (ячейка) кода может быть исполнена на машине нужного типа, при этом результаты предыдущих вычислений сохранятся. Для переключения на машину другого типа теперь не придётся запускать весь проект заново. Это ускоряет разработку, снижает затраты и повышает эффективность применения более дорогих вычислительных ресурсов.

Когда стадия preview завершится и сервис будет запущен в коммерческую эксплуатацию, в DataSphere станет доступна ещё одна уникальная функция, которой нет в других облаках, — сохранение версий расчётов моделей по трём измерениям: данные, код и состояние ноутбука. Функция упростит командную работу специалистов по данным, сделает ML-разработку более управляемым процессом для корпоративных пользователей. Также появится возможность проверить качество кода и получить рекомендации, как оптимально использовать вычислительные ресурсы.

Яндекс.Облако открывает доступ к новому сервису для разработчиков машинного обучения Yandex DataSphere

Правительство сделало ставку на "Лукоморье", no-code и другие структуры "Сбера" и "Ростелекома"

Московская область провела закупку ПАКа виртуализации для ЦОДа

Почти половина российских компаний не тратятся на защиту ИИ

Годовой эффект от внедрения ИИ-решений в "Самолете" составил около 200 миллионов рублей

Сеченовский Университет запустил цифровую лабораторию по работе с клеточными культурами

НМТП выстроил централизованное управление ИТ-активами на базе экосистемы Naumen

"Интер РАО" и Naumen создадут систему управления ИТ-активами для электроэнергетики

Аэрофлот представил VR-тренажёры для начальной подготовки пилотов

Быть вендором — это не просто сделать устройство

Мифы вокруг ПАК: что мешает технологической независимости

Параллельный тупик. Чем заплатит российский ИТ-бизнес за поддержку отечественного

Ассоциация руководителей медиа подготовит инициативу по защите прав СМИ в работе ИИ

ИИ может разрушить карьерную лестницу целого ряда специалистов в России

45% российских компаний не выделяют бюджет на защиту ИИ

"Билайн бизнес" внедрил в России 3000 аудиобейджей, обработавших 600 тыс. часов записей

Ритейл стал крупнейшим сегментом подключений интернета для бизнеса в 2025 году