Лучшая функция поиска в PDF
Я хочу найти слово типа fooonetwo в одном файле PDF. Итак, суть в том, что я не знаю, что реальный подопечный - это foo_one_two или foo.one.two или foo-one-two или foo-one_two! или же....
Или лучше сказать, что я хочу искать слова, которые одновременно включают в себя foo и один и два. Итак, я помню, что в базе данных у нас есть такая особенность: например, запрос для поиска слов, которые начинаются с foo, а также включают в себя один и два. Так есть ли просмотрщик PDF для этого? Какой просмотрщик PDF и как это сделать.
1 ответ
Вы могли бы использовать pdfgrep
искать внутри .pdf
файлы с использованием шаблонов. Сначала вы должны установить pdfgrep
пакет,
sudo apt-get install pdfgrep
И ваша команда должна быть,
pdfgrep -in 'foo.one.two' file.pdf
Точка внутри вышеприведенного шаблона будет соответствовать любому символу (он не представляет буквальную точку). Так что найдешь foo.one.two
,foo-one-two
,foo_one_two
,
Синтаксис:
pdfgrep -in pattern file.pdf