Добавить новость

Загрутдинов: в ЖК «Воскресенское» завершили устройство кровли

Столичный суд взыскал с Никиты Преснякова долг за ЖКУ

Новый учебный корпус МОУ «Гимназия» в Раменском округе построят в 2027 г

Обыск прошел у екатеринбуржца дома из-за переписки о крафте оружия в видеоигре





Новости сегодня

Новости от TheMoneytizer

Искусственный интеллект от Directum распознает штампы на документах и экономит до 300 тыс. рублей в месяц

Dgl.ru 

Эти штампы «крадут» у сотрудников 50 часов в месяц

В ИТ-компанию Directum обратилась организация, которая каждый месяц закупает для основной деятельности около 300 устройств: аппаратов для подачи газа, датчиков, различных деталей. Каждый материально-технический ресурс (МТР) поступает с паспортом изделия. Специалист, ответственный за прием МТР, вручную просматривает паспорта устройств, классифицирует их по видам и проверяет наличие круглых цветных штампов.

Что особенного в этой, казалось бы, простой работе? Рассказывает Максим Князькин, руководитель направления по развитию внедрения и сопровождению Directum Ario:

«Дело в том, что на паспортах присутствуют самые разные штампы: квадратные, прямоугольные, круглые, треугольные. Но только круглый цветной штамп подтверждает исправность и готовность устройства к эксплуатации.

Вот несколько примеров паспортов МТР, взятых из открытых источников в интернете. К сожалению, документы заказчика показать не могу, так как заключен NDA:

На классификацию одного паспорта специалист тратил около 10 минут. В месяц это отнимало 50 часов, или 6 полноценных рабочих дней. Мы предложили компании-заказчику «переложить» рутину на плечи искусственного интеллекта. В рамках пилотного проекта обучили систему Directum Ario One выделять в общей массе штампов только те, которые были нужны нам.

Отмечу, что работы выполнялись в крайне сжатые сроки. Но благодаря богатому опыту и компетентному подходу заказчик оперативно получил результат, который его устроил».

Три этапа пилотного проекта

Расскажем пошагово, как протекали работы по распознаванию штампов в паспортах МТР.

Шаг 1. Зафиксировали цели и задачи проекта

На первом этапе определили три главных задачи, которые должна решить система Directum Ario One в рамках пилотного проекта:

  • классифицировать документы вида «паспорт МТР»;
  • определять наличие и количество цветных круглых штампов у документов нужного вида;
  • находить местоположение цветных круглых штампов.

Вместе с заказчиком установили, что испытания признаем успешными, если итоговая точность по следующим пунктам будет равна или больше 70%:

  • документы из предоставленной выборки корректно классифицированы: верно определен вид документа «паспорт МТР»;
  • верно определено наличие/отсутствие цветных круглых штампов и их количество;
  • корректно обнаружено местоположение цветных круглых штампов.

Шаг 2. Обучили сервис находить нужные штампы

В рамках нашей интеллектуальной системы Directum Ario One есть несколько сервисов, подходящих для поставленных задач – классификации документов и нахождения печати.

Обучение сервиса «Классификатор»

Для того чтобы провести корректную классификацию вида документа «паспорт МТР», мы запросили у заказчика выборку документов для обучения. Нам потребовалось около 400 примеров различных паспортов материально-технических ресурсов, чтобы загрузить их в Machine learning (машинное обучение, ML) и в результате получить модель.

Обучение одной модели на выборке занимало не более 1 часа, даже на железе с не самыми лучшими характеристиками и при условии параллельной загрузкой сервера другими ML-моделями.

Коротко о механике процесса:

  1. Из выборки заказчика извлекается текстовый слой с помощью OCR (Optical Character Recognition – оптическое распознавание символов).
  2. Каждому слову/символу присуждается вес, в зависимости от частоты повторения.
  3. Все извлеченные текстовые слои обрабатываются, формируется векторная модель вида документа:

Из Machine learning результат возвращался в виде модели. Оставалось протестировать ее на документах вне выборки и узнать точность определения вида документа. На тестовом прогоне результат составил 90%.

Обучение сервиса «Нахождение печати»

А вот здесь у нас уже всё было готово. Система Directum Ario One уже включала сервис с готовыми моделями. Ранее с помощью нейронных сетей мы обучали их на выборке около 25 000 документов находить и фиксировать количество штампов.

Оставалось только провести разметку области, где нужно искать этот штамп.

На примерах подсвечена область поиска штампа и его процент попадания в эту область

После дообучения модели мы провели тестирование и получили 92% точности по нахождению и определению местоположения штампа.

Что не вошло в пилотный проект, но оказалось полезно

В ходе тестирования мы проверяли обученные модели на различных документах и разных штампах. Так иногда нейронка срабатывала на треугольную или другую печать, наша задача сводилась к тому, чтобы научить модель извлекать только круглый цветной штамп.

Проводили тесты с прямоугольными штампами, их наша модель успешно не находила.

Также в ходе тестирования мы обнаружили, что ML-модель находит незавершенные круглые цветные штампы. Это в целом повысило процент корректного нахождения до 94%.

Шаг 3. Удивили заказчика результатом

После завершения тестирования мы продемонстрировали результаты представителям заказчика, и они признали испытания успешными.

Однако коллеги не сразу поверили, что всё теперь делает искусственный интеллект. В момент встречи они попросили прогнать через нашу систему еще парочку документов, которых ранее не было в тестовой выборке. Мы были к этому готовы. Прогнав через Directum Ario One новые документы, получили результаты ничуть не ниже итоговых на пилоте.

По результатам пилотного проекта и испытаний заказчик получил финальный документ с результатами тестирования – «Протокол оценки точности классификации, определения наличия штампа и его местоположения». Дополнительно руководитель пилотного проекта прокомментировал каждый документ с распознанными или нераспознанными штампами.

Результаты пилотного проекта:

Также мы сообщили заказчику, что полученные показатели можно улучшить. Один из возможных вариантов – предоставить дополнительные выборки документов различных форм. Компания Directum планирует развивать полученные на пилоте модели и обучать их на новых штампах треугольной и прямоугольной формы.

Если читателям будет интересен описанный опыт, и они захотят протестировать или попробовать на своих данных или задачах наши интеллектуальные сервисы, команда Directum Ario One всегда открыта к пилотным и промышленным проектам.

Илья Петухов, руководитель развития AI-продуктов в компании Directum

Сообщение Искусственный интеллект от Directum распознает штампы на документах и экономит до 300 тыс. рублей в месяц появились сначала на Журнал Digital World - новости, тесты, обзоры телефонов, планшетов, ноутбуков.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

МИД КНР — о гибели Насраллы: Китай выступает против обостряющих конфликт шагов

Певец Данко показал видео из своей гримерки в Пензе

Именитые шеф-повара устроят дегустацию своих блюд в центре Улан-Удэ

Каждый десятый россиянин покупает премиум-товары в кредит

Музыкальные новости

Можно ли перевестись из одной автошколы в другую в процессе обучения?

Сергей Светлаков пригласил турецкую звезду Бурака Озчивита сыграть в продолжении «Беляковых в отпуске»

Желдорреммаш определил лучших работников локомотиворемонтных заводов 2024 года

Вашкевич: Cтараемся приблизить требования к тем, что ждут игроков в «Локомотиве»

Новости России

В США планируют ввести санкции против российского гелия

Именитые шеф-повара устроят дегустацию своих блюд в центре Улан-Удэ

Тематические экскурсии в «Москино» доступны для жителей и гостей столицы

Против Санду остался единственный «пророссийский» политик

Экология в России и мире

От аспирина до фосарбина. За что любили народного академика Арбузова?

Почему туристов в Сочи называют странным словом  «бздых»

НОВЫЕ «ОПАСНЫЕ СВЯЗИ» С НОВЫМ ВЕДУЩИМ НА «ЧЕ!»

Коллекция Nensi Dojaka весна-лето 2025

Спорт в России и мире

Рахимова обыграла Биррелл и вышла во второй круг WTA 1000 в Пекине

Камилла Рахимова вышла во второй круг WTA-1000 в Пекине, обыграв Кимберли Биррелл

Стало известно, кто из россиян примет участие в турнире ATP-500 в Вене в конце октября

Даниил Медведев вышел во второй круг турнира ATP-500 в Пекине

Moscow.media

Подведены итоги конкурса «Мы верим твердо в героев спорта»

Стоит ли отдавать ребенка в частную школу?

Колымская красненькая...

Портативный ТСД корпоративного класса Saotron RT-T70











Топ новостей на этот час

Rss.plus






Так ИИ есть: нейросеть для диагностики эпилепсии и умные очки от Цукерберга

Cadillac и авто 1967 года: В деле экс-замминистра обороны Тимура Иванова появились новые машины

Знаменитому футболисту СССР запретили выезжать из города. Вот что он натворил

В США планируют ввести санкции против российского гелия