Открыты во всем
Солодун
эксперт по интеллектуальным системам Huawei
Выпустив на рынок виртуальную платформу MindSpore, Huawei раскрывает весь потенциал вычислительной мощности ИИ-процессоров Ascend, снижая тем самым входные требования к отраслевой разработке ИИ. По мнению участников рынка, это позволит всесторонние возможности ИИ быстрее воплотить в реальность. О потенциале и возможностях корреспонденту ComNews рассказывает Никита Солодун, эксперт по интеллектуальным системам Huawei.
Что означает "открытость" применительно к платформе ИИ?
- Начнем с того, что все наши вычислительные комплексы построены на аппаратной архитектуре ARM. Она имеет открытые спецификации и является свободно лицензируемой. Российский процессор "Байкал М", например, также базируется на этой архитектуре. А x86, Itanium, POWER (но не Open POWER) являются проприетарными, и говорить о полной открытости соответствующих экосистем и платформ нельзя.
Платформа MindSpore - это мощный по своим функциональным возможностям и удобный в использовании инструмент, разработка которого ведется в режиме открытого кода. Его использование не ограничено аппаратными решениями от Huawei, и он может быть успешно использован разработчиками и на других платформах для решения задач ИИ.
Тем самым мы создали открытый программно-аппаратный стэк для ИИ. Мы активно в него инвестируем: обучаем студентов, организуем кооперацию среди разработчиков. Наша экосистема открыта для всех.
Одновременно с платформой Mindspore Huawei представил процессор Ascend 910. В чем его отличия от универсальных процессоров? Для каких задач он оптимизирован?
- Наш чип Ascend 910 на базе 7 нм техпроцесса оптимизирован для задач, связанных с обучением нейросетей. Ascend 910 построен на базе архитектуры Da Vinci (см. рис.). Как и большинство современных процессоров, это однокристальная система (SoC), которая, помимо непосредственно вычислительных ядер, включает в себя также элементы базовой логики и контроллеры (в частности, шины PCIe 4.0, интерконнекта на базе протокола RoCE). Физически Ascend 910 может поставляться как на системной плате, где может располагаться до четырех чипов, так и на PCIe-карте с одной SoC - это своего рода аналог графического процессора.
Рис. Архитектура Ascend 910
Рис. Архитектура Ascend 910
Архитектура Da Vinci является собственной разработкой Huawei на базе ARM. Она оптимизирована для обработки как скалярных, так и векторных или тензорных вычислений, которые широко используются при решении задач ИИ, таких как обработка больших массивов данных или обучение нейросетей. Пиковая производительность 32-ядерного Ascend достигает 256 терафлопс для операций с плавающей запятой (fp32) и 512 терафлопс для целочисленных значений (int8). Это на три порядка больше, чем у массовых процессоров для серверов вроде Intel Xeon.
В Китае на базе Ascend 910 построен суперкомпьютер Atlas 900. Он используется для обработки результатов астрономических наблюдений. В Шенчжене серверы Atlas 800, которые также базируется на Ascend 910, являются ядром интеллектуальной системы видеонаблюдения, которая применяется также для управления транспортными потоками. Есть примеры, как на базе наших решений в Китае создавались цифровые двойники городов. В России также мы видим интерес к нашим разработкам. Мы предоставили для тестирования несколько таких систем российским компаниям и готовы делать это и дальше.
Есть мнение, что для обучения нейросетей нет смысла покупать оборудование, поскольку данная задача возникает раз-два в год. Что вы готовы предложить таким заказчикам?
- Тут не соглашусь. Нейросети необходимо адаптировать под конкретную задачу (и тут важно отметить что спектр прикладных задач и областей, в которых применяются алгоритмы ИИ, расширяется день за днем) и обучать постоянно для повышения точности (и как результат более эффективного внедрения). Возьмем для примера нашего партнера ITV Group, разработчика ПО для систем видеонаблюдения. Требованием для таких систем является анализ изображений с камер в реальном времени в любых условиях, будь то ночь, туман, осадки. И системы от тех разработчиков, которые обучают их несколько раз в год, будут заведомо неконкурентоспособными. В ITV Group на базе оборудования Huawei создали не имеющую аналогов в мире по производительности систему, которая позволяет, например, на базе снимков с дрона определять загруженность вагонов и состояние их колесной базы, и для этого на регулярной основе ведется работа над улучшением алгоритмов.
Мы также предлагаем нашим заказчикам разнообразные программы, направленные на тестирование, адаптацию и поддержку решений наших и наших партнеров. На территории России уже находится группа крупных специалистов в области ИИ, также мы при необходимости можем привлекать и ресурсы штаб-квартиры. Наша программа для разработчиков включает семь этапов: обучение и поддержка, начало миграции, тестирование в лаборатории, сертификация, маркетинг, пилот и запуск у заказчика. Так что подход "продать оборудование, которое будет запускаться раз в год", не для нас. Мы предполагаем, что любое наше оборудование будет эксплуатироваться в постоянном режиме, тем более что к этому все располагает.
Возможна ли интеграция MindSpore с облачными вычислительными платформами, которые предлагают как российские, так и зарубежные поставщики услуг?
- Да, мы видим перспективы и для создания облачной инфраструктуры для развития того, что называют коммунальными вычислениями, в том числе и класса ИИ как услуга, или AI as a Service. Об этом говорилось, в частности, на нашей партнерской конференции в Москве, одной из наиболее представительных в мире. Мы будем всячески приветствовать появление таких сервисов, как для публичных, так и для гибридных облачных инфраструктур и готовы их всячески поддерживать. При этом мы не навязываем партнерам исключительно свои решения, в отличие от многих поставщиков проприетарных систем и платформ.
Наше облако Huawei Cloud в Китае уже предлагает ряд сервисов, использующих ИИ, коммерческим заказчикам. Это, в частности, средства анализа видео, которые используются для наблюдения за больными и пожилыми людьми, детьми, домашними животными, разного рода мониторинговых систем по поддержанию промышленной и транспортной безопасности. Эти решения легко интегрируются с любой инфраструктурой, как традиционной, так и облачной. Поскольку облачные инфраструктуры работают в виртуальной среде, то их миграция - задача вполне решаемая, никаких принципиально не решаемых проблем тут нет. Возможно, чуть легче будет пользователям облаков от Amazon, который, так же как и мы, использует архитектуру ARM.
Наряду с эффективным исполнением кода в качестве преимущества Mindspore объявлена простота разработки и адаптации под различные сценарии использования. В чем это заключается?
- MindSpore как платформа представляет массу удобных инструментов для отладки, работы с датасетами, а также содержит уникальные алгоритмы, позволяющие тренировать модели быстрее, что важно, учитывая сложность современных алгоритмов и временные затраты на их тренировки.
Обучение нейросетей - задача чрезвычайно сложная и трудоемкая. На ее решение могут уходить месяцы. У нас же есть готовые сценарии, которых накоплено около 40. В итоге нет необходимости обучать нейросеть с нуля или искать аналоги в каком-нибудь репозитории вроде GitHub, которую потом адаптировать под свои задачи.
Среди этих сценариев - разнообразные задачи, связанные с анализом изображений, как статических, так и динамических, обработкой больших массивов данных (
Есть примеры того, когда важны оба фактора. Например, на любом атомном объекте установлены сотни камер, которые отслеживают как производственный процесс, так и пересечение периметра. Аналогичные системы теперь эксплуатируются на любых производственных площадках, транспортных терминалах, а также у операторов сетей банкоматов. Есть примеры того, что ИИ контролирует сотни камер, тогда как раньше для практически каждой нужен был отдельный человек, внимательность которого к тому же после довольно непродолжительного времени многократно снижалась. ИИ же фиксирует все, что выходит за рамки типового сценария, и дает сигнал оператору, который уже принимает решение в зависимости от ситуации. Например, нетипичное поведение людей у банкомата обычно связано с двумя сценариями: попытка ограбления или человеку стало плохо. В первом случае необходимо вызывать полицию, во втором - скорую помощь.
В период пандемии оказалось востребованным распознавание результатов медицинских исследований. Человек не всегда мог отличить поражения легких, вызванные коронавирусной инфекцией, от проявлений других видов пневмоний или туберкулеза, тогда как ИИ ошибался реже. И Huawei совместно с итальянской компанией участвовал в разработке решения, направленного на помощь в диагностике COVID-19. Для обучения было использовано несколько тысяч снимков. Данная система активно используется в нескольких странах.
Однако будем честными: если разрабатывать с нуля, то все зависит от того, что необходимо получить. Тут просто нельзя корректно сравнивать разные платформы, которые используют разные аппаратные архитектуры и подходы к программированию.
Насколько ваши системы соответствуют российскому законодательству по защите данных?
- "Huawei Россия" является российским юридическим лицом и обеспечивает в полном объеме соблюдение всех действующих норм по защите данных, включая персональные. Мы один из очень немногих поставщиков облачных услуг, у которых инфраструктура находится на территории России. Более того, мы часто действуем на опережение - например, если наши заказчики вынуждены следовать нормам еще более строгого европейского регламента GDPR. А 17 июля "Huawei Россия" стала лауреатом национальной премии "Безопасная информационная среда" в номинации "Лучший зарубежный партнер" как раз за реализацию проекта по выполнению требований законодательства РФ в области обработки и защиты персональных данных.