Как я могу преобразовать файлы.epub в обычный текст?
Я могу просмотреть файл epub, скажем, okular, выделить весь текст и скопировать и вставить в текстовый редактор. Мне нужен метод командной строки - кто-нибудь знает такую вещь?
5 ответов
Я не знаю, стоит ли устанавливать Caliber для вашей работы, но если он у вас есть, вы можете использовать мощный конвертер для электронных книг:
ebook-convert input.epub output.txt
Выходной формат вычитается из расширения выходного файла
Я предполагаю, что могут быть некоторые инструменты / скрипты XML (XSLT), которые могут преобразовать epub в текст, поскольку epub - это, по сути, XHTML в ZIP-архиве.
Альтернативой является epub2txt - извлечение текста из документов EPUB Кевина Буна, также доступного на Github.
epub2html - это простая утилита командной строки, предназначенная для извлечения текста из документов EPUB и, при необходимости, для его перетекания в соответствии с отображением текста определенного числа столбцов. Он полностью написан на ANSI-стандарте C.
Пример использования:
epub2txt input.epub > output.txt
MuPDF может конвертировать из epub
в html
а также txt
, Чтобы установить его:
sudo apt install mupdf mupdf-tools
Чтобы использовать это:
mutool convert -o somefilename.txt somefilename.epub
Предполагает txt
выход из -o
вариант.
Видеть mutool convert
документация для получения дополнительной информации.
Может быть, Калибр может удовлетворить ваши потребности?
Чтобы преобразовать документ epub в обычный текст из терминала:
pandoc input.epub | lynx --stdin --dump > output.txt
Предполагается, что
pandoc
а также
lynx
уже установлены.