Платные и бесплатные программы для распознавания текста

Распознавание документов на частном примере — обзор доступных платных и бесплатных решений

Всем привет! Типичная ситуация сложилась в компании, в которой я работаю. В бухгалтерии вечный аврал, людей не хватает, все занимаются чем-то безусловно важным, но по сути бесполезным. Такое положение дел не устраивало руководство.

Если подробнее, то проблема в том, что ресурсов бухгалтерии не хватает на текущие задачи, а выделять ставки под новых людей никто не хочет. Поэтому сверху приняли решение порезать некоторые задачи и освободить время бухгалтеров для более полезных дел. Под нож попала такая работа как сканирование и распознавание документов, копирование, внесение их в прочие рутинные радости.

Так передо мной, как аналитиком, встала задача: найти решение для распознавания документа типичного для моей компании — счет-фактуры — структурировать его в имеющиеся хранилища, а также в 1С. Решение, которое будет удобным, понятным, и не влетит компании в копеечку.

Опыт получился занятным, решил поделиться тем, что удалось собрать. Возможно я что-то упустил, поэтому велком в комментарии, если есть, что добавить.

Программы сканирования документов, программы распознавания документов — не новое решение на рынке, его можно найти как в бесплатных программах, так и встроенных в системы.

Начал я с бесплатных программ:

  • glmageReader
  • Paperwork
  • VietOCR
  • CuneiForm.

В ходе распознавания нашего счета-фактуры такими программами я увидел следующее:

  • В таких программах как VietOCR, Paperwork, glmageReader можно настроить хранение отсканированных документов в определенные папки, Paperwork умеет их даже сортировать, согласно меткам.
  • В основном они хорошо справляются с текстом, а там, где текст распознан некорректно, в некоторых программах можно вручную изменить содержимое, прежде чем экспортировать файл.

Однако есть и проблемы:

  • Есть разница между работой с pdf сканами и png. Не всегда удается удачно конвертировать png в pdf.
  • Большинство таких программ сложно справляются с распознаванием документов табличного вида, даже самого простого формата. В результате мы получаем распознанный текст без размеченных полей.

  • Иногда неточно определяется шрифт, вследствие чего при конвертации весь распознанный текст наезжает друг на друга.
  • В процессе распознавания иногда необходимо делать выравнивание по ключевым словам, с доворотами и смещением координат.
  • В некоторых программах таблица распознавалась как картинка и экспортировалась в новый документ Word тоже в качестве картинки, очень урезанной, которую даже сложно разглядеть.
  • При редактировании распознанного содержимого в некоторых программах возникали проблемы, менялся шрифт или сам текст.
  • Технология сработала достаточно хорошо, Учитывая, что программы бесплатные, описанные выше проблемы допустимы. Однако, я искал более упорядоченного решения.

    Затем я исследовал распознавание в ABBYY FineReader 15 Corporate

    За 7-дневный срок триала я изучил и эту платформу.

    • Когда я открыл png файл, он отлично был считан и в результате удачно конвертирован в pdf без потери качества изображения и текста.
    • Программа отлично знает, как отсканировать документ для редактирования текста. Причем в режиме редактирования файла формата png текст удается отредактировать без проблем, но иногда слетает разметка.
    • Однако то же самое я не могу сказать про редактирование файла-скана pdf. При попытке редактирования летели слои.
    • Табличный вид распознается качественно, вся структура сохраняется, меня это порадовало.
    • OCR редактор хорошо распознал мой сформированный pdf счет-фактуры. Где-то пару символов требовалось поправить вручную.



    Однако, была ситуация, что почти весь подобный документ распознался с меньшей точностью и данных для изменения вручную было уйма. Думаю, здесь можно было бы решить вопрос технически, но это затратило бы больше времени.

  • Здесь можно настроить автоматическую конвертацию входящих документов, которые регулярно будут тянуться из указанной папки, по указанному расписанию.
  • Он позволяет сравнивать версии документов, даже если они в разных форматах. При большом потоке документов и правок в них, это очень удобно.
  • От использования этого софта были приятные впечатления. Однако, когда я обратился к ценнику системного решения ABBYY Flexicapture (а мне нужно именно системное), то выяснил, что решение, особенно кастомизированное, обходится в довольно круглую сумму, около 400 тыс. руб./мес. и выше за 10 тыс. страниц.

    Я стал искать альтернативу. Как освободить руки сотрудника, получить качественное распознавание документов и не переживать за сохранность и структуру данных.

    И тут я решил получше разглядеть ELMA RPA, которую я уже изучал ранее.

    Вендор предлагает перекинуть значительную часть работы по экспорту данных в ERP с плеч бухгалтеров на роботов. По сути, именно это решает поставленную передо мной задачу. Чтобы познакомиться с распознаванием в этой системе, я взял у вендора триальную версию системы.

    Здесь я обнаружил, что распознавание не преследует цели конвертировать полученные данные в новый документ-файл.

    Здесь главная цель — распознавание реквизитов документа и их передача в другие системы/сайты/приложения. Кроме того, роботы складывают всю информацию куда надо: автоматически находят нужные папки и сохраняют в необходимых форматах.

    Какие виды распознавания в системе я посмотрел:

    Распознавание по шаблону

    Нам предлагается на основании шаблона документа распознать подгружаемый документ. Насколько мне известно, этот вид распознавания бесплатный, внутрь зашит движок Tesseract.

    • Этот вид распознавания работает именно со сканами формата jpg и png, pdf он пока не рассматривает. Но продукт еще молодой, думаю, все впереди.
    • Этот вид распознавания входит в бесплатную версию Community Edition
    • Удобно размечен текст по блокам, которые можно сопоставить, согласно переменным, которые мы создали в контексте робота. Таким образом вручную настроить, что именно тянем в распознавание.
    • Нашу счет-фактуру он распознал 50/50, некоторые слова подменил как посчитал нужным. 🙂


    Однако, вендор на данный кейс сообщил, что этот вид распознавания адаптирован под простые документы, с текстовой структурой или с легкими формами. И посоветовал для распознавания счета-фактуры использовать другой вид распознавания — intellect lab.

    Процесс тот же, загружаем шаблон и по нему распознаем. Но здесь шаблон отправляется на облачный сервер.

    От сервера получаем ответ (распознает такой тип документа или нет), и если распознается, то передается структура шаблона (переменные для маппинга), для сопоставления переменных, которые необходимо будет записать в RPA процессе.

    В процессе воспроизведения мы отправляем уже документ, который хотели бы распознать и получаем ответ от iLab сервера о распознавании.

    Что отметил по поводу этого распознавания:

    • Здесь уже распознавание работает как программа сканирования документов pdf, и при этом работает и с форматами jpg и png.
    • Качество документа не влияет на эффективность распознавания. Даже документы с плохим качеством распознаются корректно.
    • Счет-фактура распозналась полностью и без подмен переменных.
    • Робот сумел получить скан с почты, распознать его и создать его экземпляр в 1С. То есть автоматически сохранил файл там, где мы ему задали, что, естественно, крайне удобно.
    • Входит в бесплатную Community Edition в виде распознавания документа в облаке. Подходит, если используем стандартные типы (СФ, УПД, АВР и др.), и, например до 100 документов в месяц или до 500 в год. (Стоит заметить, что считаем не в страницах, а в документах непосредственно.)

    Сам процесс распознавания документов довольно сложно отобразить на видео, так как это происходит в коробке, а экран пустует несколько секунд. Поэтому я сделал отдельную запись распознанных данных в блокнот для визуализации.

    Соответственно, эти же данные робот записывает в 1С, создавая там новый документ:

    Что удалось выяснить по ценам: Если мы, например, хотим работать масштабно именно с ilab распознаванием, то за наши 10 000 документов придется выложить:

    • примерно 180 000 руб. единовременно,
    • плюс, допустим, 400 000 руб. покупка робота с оркестратором
    • итого: 580 000 руб.

    Робот бессрочный, а 10 000 документов на какое-то время хватит. Довольно выгодно получается, как минимум в том, что заплатим за все один раз.

    Что понравилось в распознавании в этой платформе в целом:

    • Можно настроить получение документов по событию, а также, например из электронной почты и любых других внешних источников. У меня пока была цель настроить получение с почты.
    • Все считанные данные с документа можно спокойно записать в контекстные переменные и далее их передать в необходимые системы, приложения, сайты, ВМ и т д. И я не переписываю уже ничего руками.
    • Скорость обработки. 15 секунд и объект распознан, а остальной порядок действий — это счет по минутам. Если заявиться с потоковым сканированием с большим количеством документов, думаю это не составит больших временных затрат.
    • Много качественного функционала в свободном доступе, для небольших компаний им можно вполне обойтись.

    Программы для распознавания текстов

    OCR CuneiForm

    Бесплатная программа для распознавания отсканированных или сфотографированных тестов. Понимает любой печатный шрифт и сохраняет структуру документа. Позволяет отправлять результаты в текстовые редакторы.

    ABBYY FineReader

    Программа для распознавания печатных символов. Утилита отличается высокой точностью в работе при преобразовании отсканированных снимков в цифровой формат документов.

    Readiris

    Программа для сканирования и оцифровки документов. Поддерживает оптическое распознавание текстов на многих языках, включая русский, и экспорт в большое число форматов, в том числе PDF и XPS.

    RiDoc

    Программа для удобного сканирования и уменьшения размера офисных документов без потери в качестве. Также поддерживается функция распознавания текста, наложения водяного знака и экспорт офисных файлов в формат изображений.

    VueScan

    VueScan – приложение для расширения функционала старого сканера (совместимо с более чем 600 моделями). Сканируйте слайды, негативы и старые фотографии без потери исходного качества.

    TopOCR

    Программа для распознавания, простого редактирования, а также чтения текста вслух. Поддерживает 11 различных языков и может напрямую работать со сканером. Позволяет быстро переводить документы и создавать аудиокниги.

    SimpleOCR

    Программа для распознания рукописного и машинного текста, написанного на английском, французском и датском языках. Также считывает информацию со сканера и преобразовывает ее в форматы TXT, DOC или TIFF.

    FBReader

    FBReader – небольшое приложение для чтения текстовых документов формата FB2. Оно корректно отображает электронные книги с картинками, графиками и сносками, а также поддерживает быстрый переход между страницами.

    Capture Text

    Программа для перевода оптического текста в цифровой формат. Подходит для оцифровки текстовой информации, которую нельзя перевести в буфер обмена, а также распознавания отсканированных бумажных документов.

    Informatik Scan

    Программа для сканирования и распознавания документов. Поддерживает все устройства, работающие по наиболее популярному протоколу TWAIN. Содержит интегрированный редактор изображений, позволяющий удалить «засвеченные» области.

    Eсли вaм нужно отскaнировать печатный документ и распознать его на компьютере, чтобы дальше приступить к редактированию, прежде всего, необходимо скачать программы для распознавания текстов.

    Этот софт подразумевает распознавание текста с фотографии, то есть, вы запросто сможете перенести написанное в книге, журнале или каком-нибудь документе в тeкстовый рeдактор Micrоcoft Оffice или Open Оffice. Вы можете испытать такой популярный продукт как ABBYY FineReader.

    Но сразу укажем – бесплатно предоставляется лишь пробная версия. В тo жe врeмя, есть и полностью бесплатные аналоги, мало чем уступающие в функционале. Например, OCR CuneiForm.

    Сервисы для распознавания текста — подборка лучших

    Заказчик прислал сканы рабочих документов, в университете скинули фотку конспекта? Когда-то тексты умели распознавать только сканеры и то далеко не все. Сейчас же даже приложения на смартфоне могут перевести визуальный текст в редактируемый документ. А в этом материале ищем лучшие сервисы по распознаванию текста для вашего компьютера и смартфона тоже.

    Finereaderonline.com

    Компания ABBYY идет в плане распознавания текстов и обработки цифровых документов впереди всех. В арсенале их софта даже цифровые подписи, которые почти невозможно отличить от настоящих. Finereaderonline поддерживает почти 200 языков, работает быстро и онлайн — ничего не надо устанавливать. Можно выбрать разные форматы для сохранения текста, обработка текста происходит очень быстро и достаточно точно. Единственный нюанс — лимит на загрузку файлов до 100 Мб. Но никто не запрещает вам загрузить несколько документов подряд. Сервис работает полностью онлайн, русифицирован и интуитивно понятен в управлении.

    Sodapdf.com

    Еще один неплохой сервис, хотя тут нам предлагают скачать прогу отдельно. Правда, чуть менее обученный, чем софт от ABYYY — Sodapdf знает только 46 языков. Впрочем, если вам не нужно переводить с ацтекского или зулу, то проблем не возникнет. Программа условно бесплатная — есть триальная версия, полный функционал стоит от 7 до 17 евро в месяц в зависимости от пакета. Soda умеет конвертировать разные форматы, распознавать тексты, ставить электронные подписи и имеет большой набор инструментов для работы с PDF файлами и изображениями.

    WinScan2PDF

    Элементарная, простая маленькая утилита, которая состоит из трех кнопок: «выбрать источник», «сканировать» и подтвердить или отменить операцию. Поддерживает 23 языка, работает с многостраничными файлами и сохраняет обработанный файл в формате PDF. У этой программы есть одна особенность — она не работает с готовыми файлами и считывает документы только с подключенного сканера.

    Free Online OCR

    Не такой симпатичный, как Finereader, но тоже вполне умелый онлайн-сервис. Англоязычный, слегка устаревший интерфейс, в котором, впрочем, несложно разобраться. Free Online OCR поддерживает 106 языков и распознает текст с большинства самых популярных форматов файлов: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu. Сохранять готовые доки может не только в PDF, но и в стандарных doc и txt. Кроме текста, может распознать математические уравнения, правильно форматировать текст в колонках и столбцах или обработать только выделенный фрагмент. Качество распознавания довольно высокое даже c картинок низкого качества.

    Microsoft OneNote

    Распознавание текста здесь скорее дополнительная фича, а не основная задача. Вы можете вставить картинку в текущую запись OneNote и правой кнопкой мыши выбрать «Копировать текст из рисунка». Цифровая записная книжка от Microsoft однозначно не подойдет для обработки больших файлов, документов и постоянной работы с файлами. Но может помочь в мелких повседневных задачах — перевести небольшой текст с картинки, скриншота, рекламного макета, чтобы не вводить вручную. Качество распознавания у OneNote не очень высокое, а добавлять в файл многостраничные документы неудобно. Но OneNote и не для этого все-таки.

    Readiris

    Мощный и удобный конкурент ABBYY FineReader. Быстро и очень чисто распознает даже едва различимые тексты, при этом поддерживает 137 языков, включая русский. Работает очень быстро и легко обрабатывает даже большие объемы текста. Сохраняет исходное форматирование, не игнорируя кавычки, размеры шрифта и стиль написания. Может почистить текст от помарок и предложить исправления в словах. Знает символы, уравнения. Контактирует со сканерами, облачными сервисами, поддерживает кучу форматов. В общем, полноценный и удобный сервис, который не умеет разве что редактировать итоговый файл PDF. Правда, за полный инструментарий придется платить, но есть бесплатная триальная версия.

    Img2txt.com

    Приятный дизайн, понятный интерфейс и высокая скорость обработки текста — что еще нужно для работы? Продвинутые алгоритмы распознавания помогают считывать документы даже плохого качества. Молниеносно конвертирует большие объемы текста, но при желании можно выбрать отдельную область файла для работы. Есть интеграция с Google Documents, хороший инструментарий для работы с документами PDF. Маловато языков — всего 35, но для основных задач этого может вполне хватить.

    OCR CuneiForm

    Шустро и тщательно распознает сфотографированные или отсканированные тексты, графические файлы. Старается сохранить исходную структуру текста, элементов и шрифты. Переводит все в редактируемые форматы на выбор. В общем, стандартный набор функционала. И, что самое главное, полностью бесплатный.

    TextGrabber 6

    Полностью бесплатное приложение для смартфонов за авторством компании ABBYY. Собственно, этим все сказано — в TextGrabber 6 все хорошо с распознаванием текста, есть встроенный модуль переводчика. Программа работает с помощью камеры и на распознавание, и на перевод. Поддерживает кучу языков, работает быстро и выглядит приятно.

    Программы для распознавания текста

    Программы для распознавания текста со сканера или картинки прочно вошли в нашу жизнь, поскольку ни одно учебное и «офисное» мероприятие не обходится без поиска и сканирования необходимой документации. С помощью текстовых редакторов и электронных таблиц пользователями создаются практически все необходимые документы для работы и учёбы, однако в некоторых случаях нам приходиться проводить «оцифровку» бумажного носителя, выполнив сканирования и запустив процесс распознавания текста на компьютере. Делается это с помощью штатного сканера, который может быть как отдельным устройством, так и дополнением к основному печатающему оборудованию.

    После сканирования бумажного документа или картинки он попадает на компьютер в виде цифрового изображения. При этом у пользователя нет возможности отредактировать его текстовое содержимое. Таким образом, чтобы осуществить данную операцию, текст отсканированного документа необходимо распознать. Такая возможность позволит перенести текстовое содержимое в любой редактор и впоследствии провести необходимые корректировки.

    Безусловно, самой популярной программой для распознавания текста является ABBY FineReader. Данная утилита является платной и включает в себя все необходимые функции для превращения текста из нередактируемого в редактируемый. Однако следует отметить, что кроме «гигантов» для распознавания текстов существует также и альтернативное программное обеспечение. Главным его плюсом является возможность бесплатно скачать для компьютера на базе Windows. При этом, функционал таких программ не сильно отличается от платных и позволяет решать любые вышеуказанные задачи.

    VueScan – специализированное приложение, которое максимально эффективно улучшает работу сканеров и позволяет использовать в полной мере все их доступные функции. Благодаря этому обеспечению пользователи получают возможность редактирования баланса, яркости и глубины цвета, а также обработки исходного файла без непосредственного участия сканера, что сокращает работу самого устройства.

    • 60
    • 1
    • 2
    • 3
    • 4
    • 5

    RiDoc – простая и функциональная программа, позволяющая быстро и без лишних проблем отсканировать текст и перенести имеющуюся информацию на цифровой носитель. Благодаря встроенным опциям пользователь способен регулировать качество получаемой картинки, уменьшая или увеличивая размер документа, распознавать текстовую информацию со сканера и вести учет всех документов в едином формате.

    • 60
    • 1
    • 2
    • 3
    • 4
    • 5

    ABBYY FineReader – программа для распознавания текста с широким набором функций. Теперь не нужно заботиться о качестве отсканированного или отснятого материала, исходником может служить даже фотография с мобильного устройства. Программа способна распознавать больше сотни языков, а полученный текст может быть загружен в любой текстовый редактор для дальнейших правок или пересылки по электронной почте.

    • 60
    • 1
    • 2
    • 3
    • 4
    • 5

    Scanitto Pro – это универсальная программа, способная работать со сканирующими устройствами всех производителей. Она отличается высокой производительностью и простым интерфейсом. Встроенный алгоритм самостоятельно определяет подключенные устройства и загружает необходимые драйвера. Полученные изображения могут быть отредактированы или сохранены в исходном виде на жестком диске.

    • 60
    • 1
    • 2
    • 3
    • 4
    • 5

    Readiris – это программа, которая позволяет извлекать и распознавать текст с фотографий, изображений или других цифровых документов. Благодаря использованию особой технологии достигается высокая скорость и максимальная точность работы. Программа поддерживает больше сотни языков. После окончания процедуры распознавания полученные данные можно сохранить в любом текстовом формате.

    • 100
    • 1
    • 2
    • 3
    • 4
    • 5

    CanoScan Toolbox представляет собой программу для работы с многофункциональными устройствами, которая позволяет упростить все процедуры, связанные с распечаткой и сканированием документов или изображений. Благодаря простому набору функций даже начинающий пользователь без труда справится с задачей и сможет самостоятельно задавать параметры сканирования, в том числе уровень яркости и масштаб.

    Лучшие программы для распознавания текста

    Утомительное перепечатывание текста для приведения его в электронный вид давно уже отошло в прошлое, ведь сейчас существуют довольно продвинутые системы распознавания, работа с которыми требует минимального вмешательства пользователя. Программы для оцифровки текста востребованы как в офисе, так и дома. В настоящее время существует довольно большое разнообразие различных приложений для распознавания текста, но какие из них действительно лучшие? Попробуем разобраться в этом вопросе.

    ABBYY FineReader

    Эбби Файн Ридер – самая популярная программа для сканирования и распознавания текста в России, а, возможно, и в мире. Данное приложение имеет в своем арсенале все необходимые инструменты, что и позволило ему достичь такого успеха. Кроме сканирования и распознавания, ABBYY FineReader позволяет производить расширенное редактирование полученного текста, а также выполнять ряд других действий. Программа отличается очень качественным распознаванием текста и быстротой работы. Мировую популярность она заслужила также благодаря возможности оцифровки текстов на многих языках мира, а также мультиязычному интерфейсу. Среди немногих недостатков FineReader можно, разве что, выделить большой вес приложения и необходимость платить за пользование полноценной версией.

    Readiris

    Главным конкурентом Эбби Файн Ридер в сегменте оцифровки текста является приложение Readiris. Это функциональный инструмент для распознавания текста как со сканера, так и с сохраненных файлов различных форматов (PDF, PNG, JPG и др.). Хотя по функционалу данная программа несколько уступает ABBYY FineReader, она значительно превосходит большинство других конкурентов. Главной же фишкой Readiris является возможность интеграции с целым рядом облачных сервисов для хранения файлов. Недостатки у Readiris практически те же, что и у ABBYY FineReader: большой вес и необходимость платить немалые деньги за полноценную версию.

    VueScan

    Разработчики VueScan главное внимание сконцентрировали все-таки не на процессе распознавания текста, а на механизме сканирования документов с бумажных носителей. Причем программа хороша именно тем, что работает с очень большим перечнем сканеров. Для ее взаимодействия с устройством не требуется установка драйверов. Более того, VueScan позволяет работать с дополнительными возможностями сканеров, которые даже родные приложения этих устройств не помогают раскрыть в полной мере. Также у программы есть инструмент распознавания сканируемого текста. Но данная функция пользуется популярностью только в связи с тем, что ВуеСкан – отличное приложение для сканирования. Собственно, функционал по оцифровке текста довольно слаб и неудобен, поэтому распознавание в VueScan используется для решения несложных задач.

    CuneiForm

    Приложение CuneiForm – отличное решение для распознавания текста с фото, изображений, сканера. Популярность оно приобрело благодаря применению особой технологии оцифровки, совмещающей шрифтонезависимое и шрифтовое распознавание. Это позволяет максимально точно распознавать текст, учитывая даже элементы форматирования, но при этом сохранять высокую скорость работы. В отличии от большинства программ для распознавания текста, эта абсолютно бесплатна. Но у данного продукта имеется и целый ряд недостатков. Так, он не работает с одним из самых популярных форматов – PDF, — а также имеет плохую совместимость с некоторыми моделями сканеров. Кроме того, приложение на данный момент разработчиками официально не поддерживается.

    WinScan2PDF

    В отличии от CuneiForm, единственной функцией WinScan2PDF является оцифровка полученного со сканера текста в формат PDF. Главное преимущество этой программы – простота использования. Она подойдет тем людям, которые очень часто сканируют бумажные документы и распознают текст в формате PDF. Главный недостаток ВинСкан2ПДФ связан с очень ограниченным функционалом. Собственно, больше ничего данный продукт не умеет делать, кроме указанной выше процедуры. Он не может сохранять результаты распознавания в другой формат, кроме PDF, а также не предоставляет возможности оцифровки файлов изображений, которые уже хранятся на компьютере.

    RiDoc

    РиДок является универсальным офисным приложением для сканирования документов и распознавания текста. Его функционал все-таки немного уступает ABBYY FineReader или Readiris, но и стоимость заметно меньше. Поэтому по соотношению «цена – качество» RiDoc выглядит даже предпочтительнее. В то же время, существенных ограничений по функционалу программа не имеет, и одинаково хорошо выполняет как задачу сканирования, так и распознавания. Фишкой РиДок является возможность уменьшения изображений без потери качества. Единственный существенный недостаток – не совсем корректная работа по распознаванию мелкого текста.

    Безусловно, среди перечисленных программ любой пользователь сможет отыскать ту, которая ему придется по душе. Выбор будет зависеть как от конкретных задач, которые приходится чаще всего решать, так и от финансового состояния.

    Помимо этой статьи, на сайте еще 11911 инструкций.
    Добавьте сайт Lumpics.ru в закладки (CTRL+D) и мы точно еще пригодимся вам.

    Отблагодарите автора, поделитесь статьей в социальных сетях.