© ComNews
17.03.2026

Учет пространственной структуры молекул позволил снизить ошибку предсказания более чем на 30% по сравнению с лучшими существующими нейросетевыми моделями.

Для разработки красителей, OLED-материалов, флуорофоров, фотосенсибилизаторов, биомаркеров и УФ-фильтров важно заранее знать, свет какого цвета вещество поглощает, какого - испускает, и насколько эффективно оно это делает. Проверять огромные библиотеки веществ экспериментально или с помощью квантово-химических расчетов слишком дорого и долго. Ученые Института AIRI предложили подход на основе 3D-графовых нейронных сетей, который решает эту задачу за доли секунды на молекулу.

Для обучения моделей исследователи собрали специализированный набор данных nablaColors-3D из открытых источников. В него вошли экспериментальные данные об оптических свойствах молекул в разных растворителях вместе с дополнительно рассчитанными пространственными структурами. Записи вручную сверяли с первоисточниками, ошибочные - исправляли или удаляли. Это первый крупный набор данных, где для молекул-хромофоров доступны пространственные структуры.

Наличие геометрии в данных позволило применить особый класс нейросетевых моделей - 3D-графовые нейронные сети, которые учитывают трехмерное строение молекулы. Такие модели предсказывают оптические свойства точнее, чем предыдущие нейросетевые подходы и методы вычислительной физики.

Ученые сравнили пять современных моделей, работающих с геометрией молекул: PaiNN, DimeNet++, GemNet-OC, eSCN и UniMol+. Каждую модель сначала предобучили на крупных химических датасетах, а затем дообучили на nablaColors-3D для предсказания экспериментальных спектров. Дополнительно в сравнение включили несколько сильных базовых моделей из лучших существующих решений, которые используют только информацию о химических связях без учета геометрии молекулы.

Качество предсказания оценивали по метрике MAE (нм) - средней абсолютной ошибке между предсказанной и экспериментальной длиной волны. Лучшая модель без учета геометрии достигла MAE ≈ 24 нм, а лучшая модель с учетом пространственной структуры снизила ошибку до MAE ≈ 16 нм - то есть учет геометрии уменьшил ошибку более чем на 30%. Для сравнения: квантово-химический метод TD-DFT на том же тесте давал ошибку около 62 нм. Исследователи также показали: чем точнее метод, которым рассчитана геометрия молекулы, тем лучше качество предсказаний.

"Одного лишь знания о том, какие атомы и связи есть в молекуле, недостаточно для точного предсказания оптических свойств. Пространственное расположение атомов - углы, длины связей - определяет электронную структуру молекулы, а значит, и то, как она поглощает и испускает свет. Именно это дает основной прирост точности в нашем подходе", - отметил Денис Потапов, научный сотрудник группы органической химии Центра ИИ-разработки новых лекарственных препаратов Института AIRI.

Новости из связанных рубрик