Создать один PDF из нескольких текстовых, изображений или PDF-файлов

У меня есть куча текстовых файлов, изображений и PDF-файлов, которые я хочу преобразовать в один PDF-файл. Как мне это сделать?

14 ответов

Если вы хотите использовать терминал, вы можете использовать ImageMagick. Установите его с

sudo apt install imagemagick

тогда вы можете сделать:

convert image1.jpg image2.png text.txt PDFfile.pdf outputFileName.pdf

Это сработало для меня, но проблема в том, что он конвертирует text.txt файл в изображение, поэтому вы не можете выделить текст в полученном PDF.

Установить pdftk

sudo apt-get install pdftk

Pdftk

Если PDF - это электронная бумага, то pdftk - это электронное устройство для удаления скоб, дырокол, переплет, секретное кольцо для декодера и рентгеновские очки. Pdftk - это простой инструмент для повседневных дел с PDF-документами.

Вы можете создавать PDF-файлы из текста или изображений с помощью Libre Office, а затем соединять их вместе с другими PDF-файлами.

pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf

Это также может

  • Разделить страницы PDF в новый документ

  • Поворот PDF страниц или документов

и многое другое

Подробнее здесь: Ubuntu Geek: список инструментов для редактирования PDF

Попробуйте PDF цепочку:

PDF Chain - это графический интерфейс пользователя для PDF Toolkit (PDFtk). Графический интерфейс пользователя поддерживает все общие функции инструмента командной строки в удобной форме.

введите описание здесь

Вы можете установить его либо из репозиториев по умолчанию, либо получить самую последнюю версию PDF Chain PPA.

sudo apt-get install pdfchain

Или PDF Mod:

PDF Mod - это простое приложение для изменения PDF документов.

Вы можете изменять порядок, поворачивать и удалять страницы, экспортировать изображения из документа, редактировать заголовок, тему, автора и ключевые слова, а также комбинировать документы с помощью перетаскивания.

sudo apt-get install pdfmod

введите описание здесь


Смотрите также:

Для нескольких файлов в каталоге и его подкаталогах с различными расширениями я не смог найти аккуратный ответ, так что вот оно

convert -quality 85 `find -type f -name '*.png' -or -name '*.jpg' | sort -V` output.pdf

Я использовал подстановку команд, чтобы передать выбранные элементы, возвращенные find команда в качестве аргумента convert команда. к несчастью sort -n неправильно отсортировал мои файлы, поэтому я попытался -V вариант и сделал свое дело. Также заранее убедитесь, что имена ваших файлов и каталогов находятся в естественном порядке сортировки. Например dir1, dir2, dir3 не dir1, dir_2, dir3,

Это решение, которое я использовал для преобразования нескольких файлов TIFF в PDF.

Мне пришлось создать более 6.000 PDF-файлов, начиная с 30.000 tiff. convert Расчетное время: от 6 до 7 часов.
я использовал tiffcp а также tiff2pdf, они заняли несколько секунд.

$ tiffcp 1.tiff 2.tiff ... multi.tiff
$ tiff2pdf multi.tiff > final.pdf

Этот способ действительно быстрый, потому что изображения не конвертируются, а просто упаковываются.

Может быть, есть некоторые форматы TIFF, которые не так легко работают, для меня это работает отлично.

Надеюсь, поможет.

Установите Master PDF редактор. Инструмент предлагает создание, объединение и извлечение файлов PDF. Проверьте здесь для деталей о главном редакторе PDF и установке его на Ubuntu

Попробуйте LaTeX с pdflatex,

Я никогда не использовал его раньше, но мне потребовалось около 10 минут, чтобы начать создавать.PDF-файлы с ним, и около 40 минут, чтобы настроить их именно так, как я хотел. Я включил лучшие руководства по форматированию, которые я нашел, в конце.

sudo apt-get install pdflatex && sudo apt-get install texlive

В основном вы создаете один .tex файл - например hello.tex - с языком LaTeX, затем запустите pdflatex hello.tex на этот файл, и он будет генерировать PDF. Основы языка можно найти здесь: http://www.maths.tcd.ie/~dwilkins/LaTeXPrimer/


Вот пример скелета .tex файл:

 \documentclass[a4paper,10pt]{article}

 \begin{document}

 {\footnotesize
 YOUR TEXT HERE

 YOUR TEXT HERE
 }

 \end{document}

Дополнительное дополнительное форматирование:

Чтобы добавить изображения: https://www.sharelatex.com/learn/Inserting_Images

Для разных размеров шрифта: https://www.sharelatex.com/learn/Font_sizes,_families,_and_styles

Для разных шрифтов: https://www.sharelatex.com/learn/Font_typefaces

Чтобы изменить размер страницы и поля при использовании pdflatex: \usepackage[pass,paperwidth=148mm,paperheight=210mm,margin=5mm]{geometry}

Добавив ответ сообщества выше, вы можете сделатьconvert 'ls *.jpg -tr', Принудительно заставить файл PDF иметь изображения в хронологическом порядке.

Я не могу поверить, что никто еще не упомянул латекс (текс). Он специально разработан для создания документов и может объединять текст, изображения и PDF-файлы в "основной" документ (без какого-либо снижения качества). По сути, это полный набор библиотек и расширяемый язык разметки - он существует с давних времен и до сих пор широко используется в научном сообществе.

Технически это язык набора текста.

В комплекте есть ряд утилит texlive-extra-utils завернутый в pdfjam, Чтобы присоединиться к PDF используйте

pdfjoin -o out.pdf 1.pdf 2.pdf 3.pdf

В отличие от convert он напрямую манипулирует в PDF, не конвертируя их в изображения.

Также на 18.04LTS (Bionic Beaver) в данный момент пакет pdftk не поддерживается. Я бы посоветовал pdfjam если кто-то предпочитает использовать командную строку.

1. Изображения в PDF

Инструмент, который я написал, называетсяможет объединять множество изображений в один PDF-файл. Это особенно хорошо, если вы хотите, чтобы в окончательном PDF-файле был текст с возможностью поиска, поскольку мой инструмент выполняет OCR (оптическое распознавание символов) на изображениях с помощью программы, вызываемой для объединения их в один PDF-файл.

Инструкции по установке находятся здесь: https://github.com/ElectricRCAircraftGuy/PDF2SearchablePDF#install

Поскольку это обертка вокруг tesseract, он принимает любой формат изображения, поддерживаемый tesseract, включая bmp, pnm, png, jfif, jpeg/jpg и tiff . Гиф не поддерживается. См. https://coptr.digipres.org/index.php/Tesseract-ocr:

Любое изображение, читаемое Leptonica, поддерживается Tesseract, включая BMP, PNM, PNG, JFIF, JPEG и TIFF. GIF не поддерживается http://www.leptonica.com/library-overview.html.

Чтобы преобразовать все изображения в PDF, они должны находиться в одной папке и больше ничего в этой папке. Итак, если у вас есть img1.jpg, img2.jpg, а также image3.jpg, вы можете сделать это:

      # Create an `images` dir and move all images into it
mkdir -p images
mv *.jpg images  # use `cp` instead of `mv` to copy instead of move the images

# Now combine all of these images into 1 pdf
pdf2searchablepdf images

Вот и все! Теперь у вас есть доступный для поиска PDF-файл с именем images_searchable.pdfв каталоге, в котором вы находились, когда запускали pdf2searchablepdfкоманда.

Примечание: чтобы пойти в обратном направлении и преобразовать файл PDF в набор файлов изображений , мне нравится использовать pdftoppmкак я объясняю здесь .

Чтобы преобразовать недоступный для поиска PDF-файл с именем input.pdfв доступный для поиска PDF-файл с именем input_searchable.pdf, делать:

      pdf2searchablepdf input.pdf

Видеть pdf2searchablepdf -hдля полного меню справки, включая параметры и другие примеры.

2. Текст в PDF

См.: https://stackoverflow.com/questions/20129029/a-light-solution-to-convert-text-to-pdf-in-linux/20129300#20129300

3. PDF в один PDF

См.: https://stackoverflow.com/questions/2507766/merge-convert-multiple-pdf-files-into-one-pdf/11280219#11280219

Используя Gimp, импортируйте как слои, экспортируйте как pdf:)

Gimp версия: 2.10.8

Я использую PDF-Shuffler для такого рода использования, он прекрасно работает.

sudo apt-get install pdfshuffler

Это графический инструмент. Вы просто загружаете все PDF-файлы, которые хотите объединить. Вы можете изменить порядок страниц по своему усмотрению.

Для многостраничного PDF:
Конвертируйте все файлы в pdf, затем присоединитесь, используя программу записи pdf, например. pdftk, pdfill, Microsoft Print to PDF, CutePDF и т. д.

Для одностраничного PDF:
Конвертировать все файлы в изображения, например. PNG, названный в последовательности. Затем присоединитесь к одной странице с помощью конвертера изображений, например. imgconv

imgconv.exe -append *.png out2.pdf (для вертикальной)
imgconv.exe +append *.png out2.pdf (для боком)

Могут быть некоторые конвертеры, которые могут манипулировать в других форматах или даже обрабатывать исходные форматы ввода перед выводом в pdf. Все программы, упомянутые здесь, бесплатны.

Другие вопросы по тегам