© ComNews
12.03.2026

Новая нейросеть компании "Биорг", резидента "Сколково", видит рукописные символы, подобно человеку: воспринимает на изображении всю информацию сразу, а не поэтапно. Такой подход обеспечивает точность на уровне от 80% даже для распознавания "шумных" рукописных данных в штампе регистрации паспорта, без видеокарт (GPU). Технологию можно масштабировать для оцифровки и других типов документов.

На первом этапе нейросеть научили понимать рукописный текст в простых строках, а затем "читать" сложный и "шумный" текст, где рукописные символы чередуются с печатными. В результате модель за 3-4 секунды обнаруживает признаки символов, понимает их вектор и декодирует его. Таким образом, на любом рукописном фрагменте ИИ распознает данные с полнотой и точностью (accuracy) на уровне 80 процентов, вне зависимости от типа документа.

Нейросеть тренировали на открытых массивах и собственном наборе данных "Биорг" с применением реальных и синтетических изображений – всего потребовалось более 30 тыс. единиц изображений. Дополнительное обучение даст возможность поднять показатель точности выше 90%.

"Технология актуальна не только для распознавания штампов регистраций в паспорте, но и для автоматической оцифровки рукописных фрагментов справок, трудовых книжек, военных билетов и других форм в бизнес-процессах банков, страховых компаний и других корпоративных заказчиков. Следующий шаг - мы перенесём доработку из SaaS-версии в "коробочный" вариант нашего ПО "Биорг.Документы". Качественное распознавание рукописных данных – очередная веха на пути непрерывных улучшений, которого мы придерживаемся", - говорит генеральный директор "Биорг" Руслан Алигаджиев.

Проблема распознавания рукописных данных традиционно заключается в отсутствии единого стиля написания букв. В штампе регистрации паспорта ситуация усугубляется наличием "шума": вперемешку с рукописным встречается печатный текст, расстояние между строками варьируется, отсутствует геометрическая последовательность, нет единообразия написания адресов, - всё это драматически влияет на качество распознавания.

В отличии от классических подходов, где нужно определить тип документа, довернуть его, превратить слова в строки и распознать их, нейросеть "Биорг" воспринимает изображение как цельный набор данных (end-to-end).