Как я могу преобразовать файлы.epub в обычный текст?

Я могу просмотреть файл epub, скажем, okular, выделить весь текст и скопировать и вставить в текстовый редактор. Мне нужен метод командной строки - кто-нибудь знает такую ​​вещь?

5 ответов

Решение

Я не знаю, стоит ли устанавливать Caliber для вашей работы, но если он у вас есть, вы можете использовать мощный конвертер для электронных книг:

ebook-convert input.epub output.txt

Выходной формат вычитается из расширения выходного файла

Я предполагаю, что могут быть некоторые инструменты / скрипты XML (XSLT), которые могут преобразовать epub в текст, поскольку epub - это, по сути, XHTML в ZIP-архиве.

Альтернативой является epub2txt - извлечение текста из документов EPUB Кевина Буна, также доступного на Github.

epub2html - это простая утилита командной строки, предназначенная для извлечения текста из документов EPUB и, при необходимости, для его перетекания в соответствии с отображением текста определенного числа столбцов. Он полностью написан на ANSI-стандарте C.

Пример использования:

epub2txt input.epub > output.txt

MuPDF может конвертировать из epub в html а также txt, Чтобы установить его:

sudo apt install mupdf mupdf-tools

Чтобы использовать это:

mutool convert -o somefilename.txt somefilename.epub 

Предполагает txt выход из -o вариант.

Видеть mutool convert документация для получения дополнительной информации.

Может быть, Калибр может удовлетворить ваши потребности?

http://manual.calibre-ebook.com/faq.html

Чтобы преобразовать документ epub в обычный текст из терминала:

      pandoc input.epub | lynx --stdin --dump > output.txt

Предполагается, что pandocа также lynxуже установлены.

Другие вопросы по тегам