Существует ли программное обеспечение для сканирования и архивирования документов?
Я ищу какое-то приложение для управления документами (с открытым или открытым исходным кодом), которое позволило бы мне хранить бумажные документы на моем персональном компьютере, позволяя мне добавлять поля информации с вводом данных, чтобы иметь возможность вернуть цифровую копию.
например, если документ является штрафом, я могу найти его, если я помню дату или тот факт, что это штраф или другое настраиваемое поле, которое я мог бы добавить к поиску.
ocr полнотекстовый поиск был бы большим плюсом, но не обязательным.
Спасибо всем!
5 ответов
Сообщество LogicalDOC может быть использовано для этой цели. Позволяет каталогизировать и маркировать файлы многих типов и имеет встроенный бесплатный OCR.
Одна из функций, которая мне действительно нравится в этом пакете, - это полнотекстовая поисковая система, которая может выполнять поиск по языку.
Для установки на Ubuntu есть хорошая документация, которая не вызывает особых сложностей.
Существует несколько систем управления документами с открытым исходным кодом и решений для сканирования, которые помогут вам удовлетворить ваши потребности в архивировании. Для управления документами есть:
- OpenKm (кажется, включает в себя OCR, хотя не сразу понятно, является ли это частью сообщества)
- EDMS майя (включает OCR, чистый проект OpenSource, написанный на Python, так что просто
pip install mayan-edsm
) - KnowledgeTree
- ЛетоДМС (кажется довольно мертвым)
- OpenDocMan
- Nuxeo
- Фенг Офис
- Project Looking Glass
Что касается сканирования программного обеспечения, есть несколько вариантов с открытым исходным кодом, но ничего, что не будет работать слишком хорошо. В зависимости от того, что вы ищете в архиве (и как вы планируете получить к нему доступ в будущем), вы можете просто пометить свои документы соответствующим образом в своем программном обеспечении для управления. Кроме того... вы вряд ли найдете надежное распознавание текста в любом бесплатном приложении для сканирования.
Если у вас есть возможность, я настоятельно рекомендую аутсорсинг проектов преобразования документов. Мало того, что вы сделаете это быстрее - у вас будет возможность распознавать ваши файлы и знать, что готовое качество вашего проекта будет профессиональным и легко читаемым.
Существует система управления документами, которая делает в значительной степени именно то, что вам нужно, называется Archivista. Я оценил это для архива нашего музея.
Его можно загрузить в виде устанавливаемого ISO или приобрести предварительно установленный на компьютерах малого бизнеса. Однако я не знаю возможности установить его под Ubuntu, что может оказаться для вас проблемой. Здесь мы просто запускаем ее как виртуальную машину и взаимодействуем с ней через переадресацию X и ее HTML-интерфейс.
Archivista утверждает, что программное обеспечение рассчитано на длительные (около 20 лет) периоды хранения данных. Он может использовать сканеры и хранить изображение отсканированного документа, PDF и OCR-версию. Документам могут быть назначены метатеги, а их текст OCR доступен для поиска.
Я думаю, что вы ищете программное обеспечение для управления каталогами документов. Я использую Caliber для управления своими электронными книгами. Помимо PDF, он также поддерживает форматы MOBI, LIT, PRC, EPUB, ODT, HTML, CBR, CBZ, RTF, TXT, PDF и LRS.
Я не уверен, поддерживает ли он формат Ms doc. Но вы можете проверить это. Пожалуйста, посетите официальный сайт для получения дополнительной информации
Чтобы установить калибр, используйте следующую команду.
sudo apt-get install calibre
Информационная иерархия помогает вам совместно создавать документы в Интернете или с помощью инструментов Microsoft Office. Вы можете быстро организовать, хранить и размещать свои документы через dataentry.ie