Редколонка / август 2020
Чтобы нейросеть быстро училась

Яков
Шпунт

обозреватель проекта Vision
© ComNews
24.08.2020

Искусственный интеллект (ИИ) и машинное обучение давно стали не просто модными технологиями, интерес к которым быстро растет, а потом так же быстро ослабевает. Да, развитие ИИ пережило целых два громких падения - в 1960-е и 1990-е годы, однако нынешняя волна развития пока не думает убывать. Интерес к отдельным субтехнологиям может снижаться, но это компенсируется тем, что на плато продуктивности выходят другие.

Практика показывает, что компании, которые внедряют технологии ИИ и машинного обучения, оказываются более эффективными и успешными по сравнению с теми, кто этого пока не сделал. ИИ помогает ловить шоплифтеров в магазинах, выявлять на дорогах автомобили с неадекватными водителями или опасными неисправностями, пресекать другие нарушения. Например, по статистике Скотленд-Ярда, лишь 2% карманных воров задерживают без помощи систем видеоаналитики. Для государства развитие таких технологий дает и заметные стратегические преимущества. Не секрет, что та же разведка до 90% данных получает из анализа открытой информации, что на профессиональном жаргоне называется "крутить консервы". И тут использование ИИ открывает невиданные раннее возможности. Как следствие, появляется задача обеспечить гарантию, что работа таких систем не пойдет по непредсказуемому сценарию, проще говоря, не произойдет "бунта роботов", и, что более реально, в их функционирование не вмешаются посторонние.

А вот с этим немало проблем. Нынешние универсальные процессоры на архитектуре x86/x86-64 содержат серьезные уязвимости, устранение которых приводит к драматическому снижению производительности. Уязвимости имеются также в BIOS/UEFI, и злоумышленники уже научились их использовать. Причем детектировать эксплуатацию таких уязвимостей с помощью технических средств невозможно, это можно отследить только тогда, когда инцидент уже произошел.

Но этим проблемы не исчерпываются. Крупнейший мировой производитель микропроцессоров Intel потерял динамику развития - он так и не смог освоить процесс ниже 10 нм: переход на него сдвинут на три года. Главный конкурент - AMD, у которого с точки зрения технологий дела обстоят несколько лучше, не может поставлять на рынок чипы в достаточном количестве.

А вот процессоры на альтернативной архитектуре ARM продолжают динамично развиваться, особенно серверные и специализированные. Этому способствуют открытые спецификации и большое количество разработчиков и чипмейкеров из разных стран. Российский процессор "Байкал М" также базируется на данной архитектуре, при этом благодаря открытой архитектуре он был разработан в короткие сроки. Немалым достоинством процессоров и систем на базе ARM-архитектуры является простота. Это прямое следствие того, что используется сокращенное количество команд. В итоге количество унаследованных в экосистеме ARM проблем существенно меньше, чем у систем на базе x86. При этом производительность ARM продолжает расти. Например, с 2007 года, по подсчетам Apple, производительность чипов, которые используются в ее продуктах, выросла на девять порядков. Так что переход "яблочной компании" на эту архитектуру, о котором было объявлено в конце июня текущего года, имеет под собой вполне веские основания.

Появляются и специализированные решения на базе систем ARM. Например, процессоры Ascend на архитектуре Da Vinci от Huawei. Данные процессоры оптимизированы для задач, связанных с глубинным обучением и обработкой больших массивов данных.

Производительность критически важна для обучения нейросетей. Не случайно, что для этих задач все чаще используют суперкмопьютеры. Но их создание - довольно длительный и сложный интеграционный проект. Устройства на базе специализированных платформ, в том числе и на архитектуре ARM, существенно дешевле. Плюс ко всему, такие системы, например Huawei MindSpore, позволяют получить готовое решение практически из коробки. В итоге те, кто их использует, получают серьезное преимущество перед потенциальными конкурентами. А производительность Ascend 910 на три порядка выше, чем у старших моделей Intel Xeon. Так что даже один такой процессор уже заменяет собой целый кластер на базе x86.

Но одной только вычислительной подсистемы для создания искусственного интеллекта недостаточно. Для построения модели нужны данные, которые необходимо собирать и анализировать, а потом выявлять разного рода закономерности и зависимости. На эту сложную работу уходят месяцы, а иногда даже годы. И для успешного решения этих задач нужна емкая и быстрая подсистема хранения данных на базе технологии All-Flash - например, Huawei OceanStor Dorado, которая одинаково успешно справляется с разными типами нагрузок, в том числе OLAP, используемой при обработке больших массивов данных. К слову, интеллектуальная "начинка" СХД от Huawei также использует архитектуру ARM, что позволило улучшить производительность операций при дедупликации данных и при управлении RAID-массивами. Надежность данных комплексов - на уровне "шесть девяток".