ocrfeeder ничего не обнаруживает
Когда я пытаюсь обнаружить текст в моем jpeg, он правильно показывает все области, где он подозревает текст и изображения, но когда я экспортирую его в ODT, он создает только пустые текстовые и графические кадры.
Нужно ли как-то настраивать тессеракт?
(Я использую Ubuntu 14.10 32bit)
1 ответ
Решение
Попробуй это:
Откройте программу ocrfeeder.
Изменить двигатель: Нажмите Tools
- OCR Engine
Выберите Tesseract engine
и нажмите Edit
Где это говорит arguments engine
изменил скрипт для этого:
$IMAGE $FILE -l eng -psm 3 > /dev/null 2> /dev/null; cat $FILE.txt; rm $FILE $FILE.txt
Для экспорта документа нажмите File
- Export
Выберите желаемый формат вывода.
Если в документе есть картинки, я советую использовать html
форматировать текст.
Если есть только текст, лучше всего использовать формат простого текста txt
,