Есть ли PDF-ридер с регулярным выражением поиска
Когда я хочу найти фрагмент, например searchPart1, какой-нибудь неизвестный текст searchPart2 в текстовом файле, я использую searchPart1.*searchPart2
, Но это невозможно в любом читателе PDF, который я использую. В настоящее время я конвертирую PDF в текстовый файл и открываю его, используя less
или же geany
, а затем используйте регулярное выражение, доступное на нем.
Есть ли Pdf Reader с регулярным выражением поиска, кроме командной строки pdfgrep
1 ответ
В репозиториях pdfgrep не является читателем и требует использования терминала, но устраняет необходимость сначала преобразовывать файл pdf в текстовый файл, а затем открывать его в текстовом редакторе с поддержкой:
В дополнение к функциям, перечисленным в Synaptic, вы можете искать несколько файлов и рекурсивно. Одно большое отличие от обычного grep
в том, что pdfgrep не предоставляет номера строк, но номера страниц. man pdfgrep
есть детали.
Простой пример:
pdfgrep -in PATTERN FILENAME
Вот, i
для нечувствительности к регистру и n
дает номер страницы, а не номер строки.
Пример вывода выглядит так:
Есть короткое видео на YouTube, Pdfgrep - Поиск текста внутри PDF-файлов - также Linux CLI.