ocrfeeder ничего не обнаруживает

Когда я пытаюсь обнаружить текст в моем jpeg, он правильно показывает все области, где он подозревает текст и изображения, но когда я экспортирую его в ODT, он создает только пустые текстовые и графические кадры.

Нужно ли как-то настраивать тессеракт?

(Я использую Ubuntu 14.10 32bit)

1 ответ

Решение

Попробуй это:

Откройте программу ocrfeeder.

Изменить двигатель: Нажмите Tools - OCR Engine

Выберите Tesseract engine и нажмите Edit

Где это говорит arguments engine изменил скрипт для этого:

$IMAGE $FILE -l eng -psm 3 > /dev/null 2> /dev/null; cat $FILE.txt; rm $FILE $FILE.txt

Для экспорта документа нажмите File - Export

Выберите желаемый формат вывода.

Если в документе есть картинки, я советую использовать html форматировать текст.

Если есть только текст, лучше всего использовать формат простого текста txt,

Другие вопросы по тегам