Нейронные сети в помощь логистике

IT решения в логистике — одно из самых перспективных направлений для развития. Higl Level — это компания, отвечающая за внедрение IT технологий в Группе компаний STALOGISTIC. Ее последняя разработка — алгоритм для автоматического распознавания CMR документов для сборных рейсов.


Возможности алгоритма


Мы уже давно хотели применить нейронные сети в своей работе, — рассказывает Мотаев Роман, руководитель отдела разработки аналитических систем. Логичным казалось их использование в помощь финансовому департаменту для облегчения документооборота. Оказалось, что у них как раз есть подходящая задача.


Дело в том, что специалист по документообороту выгружает из системы CMR-накладные, правильность данных которых проверяет вручную. Работа очень кропотливая и отнимающая много времени.


Поэтому мы создали алгоритм, который сам перепроверяет и распознает нужную информацию и сравнивает ее с имеющейся в ERP-системе. Если алгоритм находит ошибку, то специалист может отфильтровать неверные документы, не проверяя при этом самостоятельно массив данных. Когда система сомневается в символе, например, «1» или «I», то она сохраняет это значение, и окончательное решение за человеком.


Как строилась работа


Мы прорабатывали уже готовые решения, однако они не удовлетворяли нас своей точностью. К примеру, тест уже готового алгоритма по распознаванию показывал погрешность в 30-40%. Это крайне высокий показатель, когда речь идет о финансовых документах. Проанализировав существующие алгоритмы, на основе открытого кода мы написали собственный, использовав свои модификации и нейронные сети. Это позволило более чем в 2 раза повысить точность распознавания и значительно снизить погрешность.


Если условно разделить работу, то написание кода занимает 30% времени, а 70% — обучение системы. Формирование data set, пожалуй, наиболее трудоемкая часть. Изначально алгоритм не знает абсолютно ничего. Чтобы обучить его, мы вручную размечаем все данные и показываем их сети. Так она начинает постепенно учиться на все большем количестве документов. Процесс это довольно долгий, но после этого сеть самостоятельно может определять буквы и символы на определенном месте.


Поскольку первый опыт оказался достаточно успешным, то уже сейчас мы масштабируем нашу работу и учим алгоритм автоматически прикладывать CMR к нужной сделке, что сейчас делается вручную, а также распознавать данные в других типах документов: счет, коносамент и т.д.

Cookie-файлы
Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта. Благодаря им мы улучшаем сайт и обслуживание на нём.