Эффективные способы поиска в recoll

Я использовал recoll некоторое время. И мне это очень нравится. Я проиндексировал все мои журналы, электронные книги, фотографии, видео, а также дикую кучу PDF-файлов со всего Интернета. Темы от обзоров фильмов до компьютерных алгоритмов и средиземноморских рецептов. Infact, для меня recoll отчасти заменил Google в том смысле, что.. Я сначала ищу свой локальный экземпляр recoll, и только когда я ничего не получаю, я открываю Google в новой вкладке и начинаю поиск..

Единственная проблема... Я до сих пор не уверен, насколько хорошо искать с помощью recoll. Я просмотрел документацию, и это немного сбивает с толку. Я имею в виду, что он поддерживает богатый синтаксис запросов и все.

Поэтому мне было интересно, есть ли у кого-нибудь представление о том, как эффективно выполнять поиск с использованием recoll? Какие модификаторы можно использовать и такие? И что именно означают все эти модификаторы? Есть 'l', 'p', 'o' и несколько других. Некоторые из этих модификаторов поддерживают добавление к ним чисел, например, "o10". В документации не очень ясно, что именно это означает. Иногда, кажется, что отключение "стемминга" дает мне лучшие результаты. Но я не совсем уверен.

Может ли кто-нибудь более просветленный, просветить меня? Спасибо

1 ответ

Я полагаю, что вы посмотрели этот раздел руководства и что он не был достаточно понятен? http://www.lesbonscomptes.com/recoll/usermanual/usermanual.html

Стемминг - это операция, которая превращает производный термин, например, "полы", "настил" в базовый (стебель): пол. Это означает, что при поиске "этажей" также будут найдены тексты, содержащие только "этаж". Иногда это нежелательно, поэтому Recoll позволяет отключить его либо с помощью заглавных букв в термине ("Этажи"), либо с помощью модификатора "l".

Обычно вход с двойными кавычками в Recoll говорит ему искать входные термины в указанном порядке, без каких-либо промежуточных терминов. При поиске "первая секунда" (на самом деле двойная кавычка в записи) не найдет тексты, содержащие только [секунду первый] или [первую секунду]

Запись в двойных кавычках можно превратить в "поиск по близости", добавив модификатор "p". "first second" p найдет тексты, содержащие [first second], а также тексты, содержащие [second first], но не содержащие только "first a second] или [second a first].

Модификатор o позволяет указать, что могут появиться некоторые промежуточные термины. Например, "первая секунда" o1 будет соответствовать [первой секунде] и [первой секунде]

Для большинства запросов вам вообще не нужны эти вещи, но иногда они могут иметь значение между поиском сотен неинтересных результатов и поиском только того, который вы хотите.

Другие вопросы по тегам