RPA + OCR: что можно автоматизировать с распознаванием…
  • RPA
  • Автор: Команда CrmAI
  • Опубликовано:
RPA и OCR для распознавания и обработки документов

Представьте бухгалтера, который каждый день получает пачку счетов-фактур от поставщиков. Бумажных или отсканированных в PDF. Нужно открыть каждый документ, найти номер, дату, сумму, БИН/ИИН поставщика, позиции — и вбить всё это в 1С. Сто документов в день. Механическая работа, от которой устаёшь и ошибаешься.

Логичная мысль: давайте научим компьютер распознавать эти документы автоматически. Технология OCR (Optical Character Recognition) существует давно, RPA умеет работать с любыми системами — казалось бы, идеальная связка. Сканируешь документ, робот распознаёт данные, вносит в систему. Красота.

На практике всё сложнее. OCR — это не волшебная палочка. Есть случаи, где технология работает блестяще и экономит тысячи часов. А есть случаи, где она создаёт больше проблем, чем решает. В этой статье разберёмся, как отличить одно от другого.

rpa-ocr-raspoznavanie-dokumentov-chto-avtomatizirovat-rpa-ocr.png

Как работает связка RPA + OCR

Разберёмся в механике, чтобы потом не было сюрпризов.

OCR — технология, которая превращает картинку с текстом в текст, который понимает компьютер. Берёт скан или фото документа и «читает» его. Современные движки используют нейросети, и качество распознавания за последние десять лет выросло радикально.

Но OCR — это только начало. Распознать текст — полдела. Нужно ещё понять, где на странице номер счёта, где дата, где сумма. Это extraction — извлечение данных из документа. Отдельная задача, часто более заковыристая, чем само распознавание.

RPA в этой схеме — «руки». Робот получает документ, отправляет на OCR, забирает распознанные данные и вбивает в 1С, SAP, CRM — куда нужно. Если что-то не распозналось — робот отправляет документ человеку на проверку.

Сейчас часто говорят IDP — Intelligent Document Processing. Это когда OCR и extraction объединены в одну платформу, которая не просто распознаёт текст, а понимает структуру документов, обучается на новых типах и сама исправляет часть ошибок.

Где OCR работает хорошо

Некоторые типы документов распознаются надёжно. Вот что у них общего.

Стандартизированные формы. Паспорта, права, свидетельства о регистрации ТОО — структура фиксированная, поля на одних местах, формат предсказуемый. OCR-системы натренированы на миллионах таких документов и выдают 95-99% точности.

Чёткий печатный текст. Хороший шрифт, контрастная печать, качественный скан. Современные счета и договоры, вышедшие из принтера — распознаются без проблем. Особенно если документ изначально был PDF и его не печатали-сканировали несколько раз.

Документы со штрихкодами и QR. Если на бумаге есть машиночитаемый код с ключевой информацией — задача резко упрощается. Код считывается без ошибок, остальное можно сверить.

Типовые документы от постоянных контрагентов. Работаете с одними и теми же поставщиками — их форматы можно «выучить». Система запоминает, что у компании X номер счёта всегда справа вверху, у Y — в шапке слева. Точность растёт.

Большие объёмы. Экономика OCR работает на масштабе. 10 документов в день — настройка не окупится. 1000 — экономия будет ощутимой.

«Мы обрабатываем около 500 счетов-фактур в день от постоянных поставщиков. После внедрения IDP-системы точность автоматического распознавания — 92%. Остальные 8% уходят на ручную проверку. Но раньше проверять нужно было все 100%. Бухгалтеры теперь занимаются только сложными случаями.»

Главный бухгалтер, торговая сеть

Где OCR буксует

А теперь — случаи, когда стоит десять раз подумать.

Рукописный текст. Системы для распознавания почерка существуют. Но работают они... так себе. Рукописные заметки, подписи с расшифровкой от руки, заполненные вручную формы — точность падает до 60-70%. Каждый третий документ придётся перепроверять руками.

Плохие сканы. Смазанные копии, низкое разрешение, страница под углом, пятна — всё это бьёт по результату. Факсы (да, кто-то ещё ими пользуется), фотки с телефона при плохом свете, копия копии копии — проблемные случаи.

Каждый раз новый формат. Поставщик А шлёт счёт с таблицей слева. Поставщик Б — справа. Поставщик В вообще обходится без таблицы, перечисляет товары в строку через запятую. Под каждый формат нужно обучать систему. Если таких форматов сотни — это много работы.

Сложные таблицы. Многоуровневые структуры с объединёнными ячейками, подитоги, вложенные списки, таблицы без видимых границ — OCR плывёт. Простая таблица «товар-количество-цена» — без проблем. Смета на 10 страниц с группировками — будут ошибки.

Мешанина из текста и картинок. Документы, где текст идёт вперемешку с графиками, схемами, штампами, водяными знаками. Система путает, что есть что. Текст на фоне картинки может вообще потеряться.

Узкоспециальная терминология. Много аббревиатур, технических терминов, названий на других языках — стандартные модели начинают ошибаться. Нужна доработка под вашу специфику.

Как оценить применимость для вашего случая

Прежде чем вкладываться в проект, проведите честную оценку.

Соберите выборку документов. Не идеальные примеры, а реальные документы, которые вы обрабатываете каждый день. Включите и хорошие, и плохие. Разные поставщики, разное качество сканирования, разные форматы. Минимум 50-100 документов для репрезентативной картины.

Проведите пилот с реальными данными. Большинство вендоров IDP-систем готовы провести proof of concept на ваших документах. Это покажет реальную, а не маркетинговую точность. Обратите внимание не только на процент распознавания, но и на типы ошибок.

Посчитайте экономику с учётом ошибок. Если точность 90%, значит 10% документов нужно проверять вручную. Насколько это дешевле, чем проверять все? А если точность 80%? А 70%? Найдите точку, при которой автоматизация перестаёт окупаться.

Оцените стоимость ошибки. Одно дело — неправильно распознать номер счёта (обнаружится при сверке). Другое — ошибиться в сумме платежа (можете заплатить лишнее). Какие поля критичны, какие можно потом поправить?

Учтите обучение и поддержку. Система требует настройки под ваши типы документов. Кто будет это делать? А когда появится новый поставщик с новым форматом — кто добавит его в систему? Это постоянная работа.

rpa-ocr-raspoznavanie-dokumentov-chto-avtomatizirovat-ocr.png

Типичные сценарии применения

Рассмотрим конкретные бизнес-процессы и оценим их пригодность для OCR-автоматизации.

Обработка входящих счетов-фактур — классический сценарий. Подходит, если у вас ограниченный круг поставщиков с типовыми форматами. Менее подходит, если поставщиков сотни и у каждого свой макет. Средняя достижимая точность — 85-95% в зависимости от качества документов.

Обработка паспортов и удостоверений личности — отличный сценарий. Стандартизированные документы, обученные модели. Точность 95-99% для качественных сканов. Широко используется в банках, страховых, HR-отделах.

Извлечение данных из договоров — сложный сценарий. Договоры неструктурированы, ключевая информация может быть в любом месте многостраничного документа. Современные системы с NLP справляются, но требуют серьёзной настройки. Точность сильно зависит от однотипности договоров.

Распознавание чеков и квитанций — проблемный сценарий. Чеки часто плохого качества, выцветшие, смятые. Термопечать бледнеет. Макеты у каждой кассовой системы свои. Для массовой обработки чеков лучше использовать специализированные сервисы, заточенные именно под эту задачу.

Обработка товарных накладных — зависит от формата. ТОРГ-12 по ГОСТ — хорошо распознаётся. Нестандартные накладные от разных поставщиков — нужно обучать под каждый формат.

Архитектура решения: на что обратить внимание

Если вы решили внедрять OCR + RPA, есть технические аспекты, которые стоит продумать заранее.

Предобработка документов. Прежде чем отправлять на распознавание, документы стоит подготовить: автоматически повернуть (часто сканируют вверх ногами), убрать шум, выровнять яркость и контрастность. Это значительно улучшает результаты.

Классификация типов документов. Если приходят разные документы (счета, акты, накладные), нужно сначала понять, что это за документ, и применить соответствующий шаблон извлечения. Это отдельный этап обработки.

Верификация и confidence score. Хорошие OCR-системы дают оценку уверенности для каждого распознанного поля. Если уверенность низкая — документ отправляется на ручную проверку. Настройте порог так, чтобы балансировать автоматизацию и качество.

Интерфейс ручной верификации. Для документов, которые не распознались автоматически, нужен удобный интерфейс. Оператор должен видеть исходный документ и предзаполненные поля, легко исправлять ошибки. Это влияет на скорость обработки исключений.

Обучение на исправлениях. Продвинутые системы используют исправления операторов для дообучения модели. Со временем точность растёт. Но это требует правильной архитектуры и накопления данных.

Чего ожидать от внедрения

Реалистичные ожидания спасут от разочарования.

Первые месяцы — много возни. Система учится, шаблоны настраиваются, исключения разбираются. Не ждите, что заработает идеально на следующий день. Заложите время на притирку.

Точность растёт постепенно. Начнёте с 70-80%, через полгода можете выйти на 90-95%. Если документы вообще поддаются автоматизации — некоторые нет.

Без людей не обойтись. Полностью автоматический процесс — редкость. Всегда будут документы, требующие человеческого глаза. Вопрос — сколько их и как организована работа с такими случаями.

Поддержка — это навсегда. Появляются новые поставщики, меняются форматы, обновляется законодательство. Кто-то должен следить и подкручивать систему. Это не проект с датой окончания — это постоянная функция.

Хотите оценить применимость OCR для ваших документов?

Проведём анализ ваших типов документов, оценим достижимую точность и посчитаем экономику внедрения. Честно скажем, если автоматизация не подходит для вашего случая.

Заказать оценку

OCR + RPA — мощная связка, но не волшебная. На одних документах даёт десятикратное ускорение и снижение ошибок. На других — создаёт головную боль и съедает бюджет без отдачи.

Ключ к успеху — честная оценка в начале. Не верьте рекламным «99% точности» — проверяйте на своих реальных документах. Считайте экономику с учётом того, что будет на практике, а не в презентации вендора. Закладывайте ресурсы на обучение и поддержку.

Если ваши документы подходят — получите крутой результат. Если нет — лучше выяснить это до внедрения, а не после. Иногда правильное решение — оставить как есть или поискать другой путь оптимизации. В этом тоже нет ничего страшного.

Полезные материалы