Сравнить два файла xls, чтобы удалить повторяющиеся строки
У меня есть два файла xls 8 МБ и 10 МБ. Я должен объединить их и удалить дублирующиеся строки. (Оба файла имеют уникальные строки, но после слияния будут повторяться строки).
Я попытался объединить файлы, но эти два файла не будут объединены из-за большого размера.
Есть ли в Ubuntu какой-либо метод удаления дубликатов из файлов, учитывая мою ситуацию?
Примечание:- Если без объединения файла дублирование может быть удалено, оно также будет приемлемым.
Моя попытка после предложений:- Я конвертировал оба файла в CSV. Затем я скопировал один файл в другой, затем удалил дублирование с помощью расширенного фильтра. Затем я сохранил новый (комбинированный) CSV в формате XLS. Но когда я снова открою новый (комбинированный) файл xls, он не покажет все данные. Это показало только 60% данных.
Размер нового (комбинированного) файла csv составляет 24 МБ, а когда я сохраняю его как файл xls, размер файла xls составляет 11 МБ.
1 ответ
Libreoffice: Данные → Фильтр → Расширенный фильтр → Параметры → Дублированные строки отключены
Вы можете скопировать содержимое обоих файлов на лист, удалить дубликаты и создать 2 новых файла, если хотите. Для этого понадобится какой-то маркер на листе, чтобы вы могли увидеть, что файл 2 запущен.
Никакой особой магии не требуется.