Российские ученые разработали метод обучения ИИ для восстановления пропущенных стадий динамики сложных систем
Главная особенность подхода - он обучает всю систему целиком без предварительного расчета промежуточных переходов между стадиями.
Задача состоит в том, чтобы по разрозненным данным, доступным лишь в отдельные моменты времени, восстановить полную динамику системы и выявить скрытые процессы, влияющие на изменения. Например, когда ученые измеряют состояние биологической клетки, она обычно разрушается, поэтому проследить, как одна и та же клетка меняется со временем, невозможно. В результате имеются данные только о состоянии популяции клеток или частиц в отдельные моменты времени. Задачи такого типа возникают не только в биологии, но и в метеорологии, эпидемиологии, физике, где наблюдения носят фрагментарный характер, а требуется целостное описание происходящего. Один из способов решать данную задачу - использовать так называемое математические методы JKO (названные в честь создателей Jordan-Kinderlehrer-Otto), позволяющие находить траекторию движения в предположении, что она описывается градиентным потоком.
Ученые института AIRI, Сколтеха и МФТИ предложили iJKOnet - новый ИИ-подход к решению этой задачи. Он сочетает метод JKO с идеями обратной оптимизации и позволяет обучать модель сразу целиком, используя лишь информацию о состояниях системы в отдельные моменты времени.
Обучение iJKOnet устроено по принципу генеративно-состязательных сетей. Одна нейросеть ищет оптимальный способ перемещения частиц, а другая формирует такой энергетический ландшафт, при котором наиболее вероятными становятся переходы, наблюдаемые в реальных данных. Таким образом, модель не просто воспроизводит наблюдения, а восстанавливает внутреннюю логику процесса. Это делает метод более масштабируемым и применимым для сложных задач машинного обучения.
Еще одно важное преимущество iJKOnet - отсутствие жестких требований к архитектуре нейросетей. Это позволяет использовать обычные многослойные перцептроны, которые хорошо работают со сложными и нелинейными зависимостями.
Важную роль в проверке метода сыграли эксперименты на синтетических двумерных задачах. Поскольку в таких тестах исследователи заранее знают, как устроена система, они могут оценить сразу два параметра: насколько точно модель воспроизводит данные и насколько хорошо восстанавливает закон, лежащий в их основе. Уже на этих тестах iJKOnet показал преимущество перед предыдущими подходами.
Дополнительно метод проверили на данных одноклеточного анализа эмбриональных телец. Ученые специально удаляли целые временные отрезки из обучающей выборки, затем модель должна была восстановить пропущенные стадии. В пространстве размерности 5 iJKOnet показал лучшие результаты среди существующих методов по метрике Вассерштейна. В пространстве размерности 100 он достиг уровня лучших современных алгоритмов, включая предшественников типа JKONet и JKONet++, но при этом оказался проще в обучении, поскольку не требует сложных процедур сохранения траекторий.
"iJKOnet потенциально может быть полезен в разных областях, где важно описывать динамику систем без возможности отслеживать каждый объект отдельно. Среди таких направлений - метеорология, например моделирование движения воздушных фронтов, и эпидемиология, где нужно описывать распространение вирусов по регионам. Мы планируем развивать метод в двух направлениях: улучшать его масштабируемость для пространств с размерностью значительно выше 100 и расширять теоретическую основу на случаи, когда энергия системы меняется со временем", - отметил Александр Коротин, руководитель группы "Основы генеративного ИИ" Института AIRI и доцент Сколтеха.

