Сравнить два файла xls, чтобы удалить повторяющиеся строки

У меня есть два файла xls 8 МБ и 10 МБ. Я должен объединить их и удалить дублирующиеся строки. (Оба файла имеют уникальные строки, но после слияния будут повторяться строки).

Я попытался объединить файлы, но эти два файла не будут объединены из-за большого размера.

Есть ли в Ubuntu какой-либо метод удаления дубликатов из файлов, учитывая мою ситуацию?

Примечание:- Если без объединения файла дублирование может быть удалено, оно также будет приемлемым.

Моя попытка после предложений:- Я конвертировал оба файла в CSV. Затем я скопировал один файл в другой, затем удалил дублирование с помощью расширенного фильтра. Затем я сохранил новый (комбинированный) CSV в формате XLS. Но когда я снова открою новый (комбинированный) файл xls, он не покажет все данные. Это показало только 60% данных.

Размер нового (комбинированного) файла csv составляет 24 МБ, а когда я сохраняю его как файл xls, размер файла xls составляет 11 МБ.

1 ответ

Libreoffice: Данные → Фильтр → Расширенный фильтр → Параметры → Дублированные строки отключены

Вы можете скопировать содержимое обоих файлов на лист, удалить дубликаты и создать 2 новых файла, если хотите. Для этого понадобится какой-то маркер на листе, чтобы вы могли увидеть, что файл 2 запущен.

Никакой особой магии не требуется.

Другие вопросы по тегам