OCRopus

OCRopus — OCR-система для распознавания текстов на базе tesseract. Использует код для языка моделирования из проекта OpenFST, поддерживаемого Google. Доступна FreeBSD, Linux, Mac OS X.

OCRopus
Тип Оптическое распознавание символов
Разработчик Thomas Breuel, DFKI
Написана на C++ и Python
Операционная система FreeBSD, Linux, macOS и Windows 10
Первый выпуск 9 апреля 2007
Последняя версия
Создаваемые форматы файлов HOCR
Лицензия Apache License v2.0
Сайт github.com/tmbdev… (англ.)
github.com/ocropu… (англ.)
 Медиафайлы на Викискладе

Использование

В настоящее время OCRopus использует только интерфейс командной строки, принимая на вход изображения с текстом, и выводя данные в формате hOCR (открытый формат на основе HTML). Опции командной строки позволяют выполнять отдельно конкретные операции (например, распознание одной строки).

История развития

  • 0.1.0 alpha — 22 октября 2007
  • 0.1.1 alpha – 14 декабря 2007 - Улучшенная система сборки
  • 0.2 alpha 2 — 31 мая 2008
  • 0.3 alpha 3 – 16 октябрь 2008
  • pre-0.4 alpha 4 – май 2009
  • 0.4.3 – июль 2009
  • 0.4.4 – март 2010
  • 0.5 – июнь 2012
  • 0.6 23 – август 2012
  • 0.7 6 – апрель 2013
  • 1.0 - ноябрь 2014

См. также

Примечания

  1. Release 1.3.3 — 2017.
  2. Release 1.3.3 — 2017.
  3. Release 1.3.3 — 2017.

Ссылки

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.