Существует ли программное обеспечение для сканирования и архивирования документов?

Я ищу какое-то приложение для управления документами (с открытым или открытым исходным кодом), которое позволило бы мне хранить бумажные документы на моем персональном компьютере, позволяя мне добавлять поля информации с вводом данных, чтобы иметь возможность вернуть цифровую копию.

например, если документ является штрафом, я могу найти его, если я помню дату или тот факт, что это штраф или другое настраиваемое поле, которое я мог бы добавить к поиску.

ocr полнотекстовый поиск был бы большим плюсом, но не обязательным.

Спасибо всем!

5 ответов

Решение

Сообщество LogicalDOC может быть использовано для этой цели. Позволяет каталогизировать и маркировать файлы многих типов и имеет встроенный бесплатный OCR.

Одна из функций, которая мне действительно нравится в этом пакете, - это полнотекстовая поисковая система, которая может выполнять поиск по языку.

Для установки на Ubuntu есть хорошая документация, которая не вызывает особых сложностей.

Существует несколько систем управления документами с открытым исходным кодом и решений для сканирования, которые помогут вам удовлетворить ваши потребности в архивировании. Для управления документами есть:

  • OpenKm (кажется, включает в себя OCR, хотя не сразу понятно, является ли это частью сообщества)
  • EDMS майя (включает OCR, чистый проект OpenSource, написанный на Python, так что просто pip install mayan-edsm)
  • KnowledgeTree
  • ЛетоДМС (кажется довольно мертвым)
  • OpenDocMan
  • Nuxeo
  • Фенг Офис
  • Project Looking Glass

Что касается сканирования программного обеспечения, есть несколько вариантов с открытым исходным кодом, но ничего, что не будет работать слишком хорошо. В зависимости от того, что вы ищете в архиве (и как вы планируете получить к нему доступ в будущем), вы можете просто пометить свои документы соответствующим образом в своем программном обеспечении для управления. Кроме того... вы вряд ли найдете надежное распознавание текста в любом бесплатном приложении для сканирования.

Если у вас есть возможность, я настоятельно рекомендую аутсорсинг проектов преобразования документов. Мало того, что вы сделаете это быстрее - у вас будет возможность распознавать ваши файлы и знать, что готовое качество вашего проекта будет профессиональным и легко читаемым.

Существует система управления документами, которая делает в значительной степени именно то, что вам нужно, называется Archivista. Я оценил это для архива нашего музея.

Его можно загрузить в виде устанавливаемого ISO или приобрести предварительно установленный на компьютерах малого бизнеса. Однако я не знаю возможности установить его под Ubuntu, что может оказаться для вас проблемой. Здесь мы просто запускаем ее как виртуальную машину и взаимодействуем с ней через переадресацию X и ее HTML-интерфейс.

Archivista утверждает, что программное обеспечение рассчитано на длительные (около 20 лет) периоды хранения данных. Он может использовать сканеры и хранить изображение отсканированного документа, PDF и OCR-версию. Документам могут быть назначены метатеги, а их текст OCR доступен для поиска.

Я думаю, что вы ищете программное обеспечение для управления каталогами документов. Я использую Caliber для управления своими электронными книгами. Помимо PDF, он также поддерживает форматы MOBI, LIT, PRC, EPUB, ODT, HTML, CBR, CBZ, RTF, TXT, PDF и LRS.

Я не уверен, поддерживает ли он формат Ms doc. Но вы можете проверить это. Пожалуйста, посетите официальный сайт для получения дополнительной информации

Чтобы установить калибр, используйте следующую команду.

sudo apt-get install calibre

Информационная иерархия помогает вам совместно создавать документы в Интернете или с помощью инструментов Microsoft Office. Вы можете быстро организовать, хранить и размещать свои документы через dataentry.ie

Другие вопросы по тегам