Искать в документах ODT, не открывая их?

Допустим, у меня есть 2000 .ODT файлов. Их имена случайные числа. Как мне искать, скажем, "список цен"? Как найти нужный мне документ, не открывая все по одному и не проверяя, подходит ли он?

Есть ли какая-нибудь программа для поиска по словам в документах, не открывая их?

3 ответа

Решение

Вам понадобится решение для полнотекстовой индексации, которое имеет фильтр для поддержки индексации полного текста этих файлов.

Одним из вариантов для этого является tracker пакет в Ubuntu. Вам нужно будет установить tracker а также tracker-miner-fs для этого, и вы также, вероятно, захотите tracker-gui для пользовательского интерфейса инструмента поиска.

Это работает для всего, что может прочитать openoffice; Я хотел odt только в этом случае:

find -name \*.odt -exec sh -c 'unoconv --stdout -f text "{}" | grep -i string_to_search_for' \;

Альтернативой является Recoll Установить Recoll, Как только он проиндексировал ваши файлы, он довольно быстро находит соответствующие файлы. Также поиск внутри ОРВ, ОРС и PDF. Работает довольно хорошо.

Другие вопросы по тегам