Как обнаружить дубликаты фотографий (даже если дубликат имеет более низкое разрешение) и как сохранить только копию с более высоким разрешением?

Просматривать тысячи фотографий с моего смартфона, перенесенных на мой компьютер, довольно сложно. Отделение пшеницы от соломы - трудоемкая ночная работа. Что делает это особенно сложным, так это WhatsApp, так как он настроен на моем телефоне (по умолчанию) отправляет / получает сжатые изображения с низким разрешением, а не с полным разрешением. Публикация фотографии, сделанной на собственном смартфоне, по моему мнению, оставит фотографию в полном разрешении на телефоне и дополнительно создаст и сохранит сжатую копию с низким разрешением и переименованную копию отправленной фотографии в каталоге WhatsApp, эффективно создав более низкую дублировать.

В качестве первой итерации предполагаемого рабочего процесса я бы хотел выбрать только уникальные фотографии (из нескольких папок и подпапок). Если данная фотография существует более одного раза (либо с одинаковым размером (одинаковым разрешением), либо с разными размерами (разными разрешениями), я бы хотел выбрать только одну копию и явно только копию с самым высоким доступным разрешением (игнорируя все более низкие -рес копии).

Опираясь на эти два связанных вопроса

Как я мог сделать это в один миг?


tldr;

Результатом / смыслом этого упражнения было бы включение в исходный выбор фотографий также фотографий, полученных в WhatsApp - при условии, что они уникальны и в другом месте не существует копии в высоком разрешении (на моем телефоне / компьютере).


Дополнительные ссылки / ресурсы:

3 ответа

У меня был такой же вариант использования, и я написал изящный небольшой скрипт для достижения этой цели.

Посмотрите, поможет ли вам и этот скрипт Python:

https://github.com/AnirudhKishan/DeleteVisuallyRedundant

Некоторое время назад, в Ubuntu 10.04, я использовал для этого DupeGuru Picture Edition. Это было довольно хорошо при поиске дубликатов в разных размерах и разрешениях. Похоже, что начиная с версии 4.0 DupeGuru Picture Edition как отдельного приложения больше нет, но его функциональные возможности были включены в основное приложение как «Режим изображения». Вы можете попробовать, однако на данный момент доступны только пакеты для Ubuntu 16.04 и 18.04 , сборки для 20.04 нет.

Пакет для 18.04 работает под 20.04, но после установки нужны дополнительные исправления. Вам необходимо выполнить следующие команды:

      cd /usr/share/dupeguru/core/pe
sudo ln -s _block.cpython-36m-x86_64-linux-gnu.so _block.cpython-38-x86_64-linux-gnu.so
sudo ln -s _cache.cpython-36m-x86_64-linux-gnu.so _cache.cpython-38-x86_64-linux-gnu.so
cd /usr/share/dupeguru/qt/pe
sudo ln -s _block_qt.cpython-36m-x86_64-linux-gnu.so _block_qt.cpython-38-x86_64-linux-gnu.so

После этого DupeGuru работает отлично.

digiKam кажется мне ответом. Гораздо мощнее, чем Шотвелл:

Инструменты> Найти дубликаты (Ctrl D)> ... [создать / обновить отпечатки пальцев]... > "Диапазон сходства" ~ 95%.

Чтобы найти "дубликаты с более низким разрешением", диапазон подобия не должен быть установлен на 100%, а должен быть достаточно близок, например 95%.

Другие вопросы по тегам