Создать один PDF из нескольких текстовых, изображений или PDF-файлов
У меня есть куча текстовых файлов, изображений и PDF-файлов, которые я хочу преобразовать в один PDF-файл. Как мне это сделать?
15 ответов
Если вы хотите использовать терминал, вы можете использовать ImageMagick. Установите его с
sudo apt install imagemagick
тогда вы можете сделать:
convert image1.jpg image2.png text.txt PDFfile.pdf outputFileName.pdf
Это сработало для меня, но проблема в том, что он конвертирует text.txt
файл в изображение, поэтому вы не можете выделить текст в полученном PDF.
Установить pdftk
sudo apt-get install pdftk
Pdftk
Если PDF - это электронная бумага, то pdftk - это электронное устройство для удаления скоб, дырокол, переплет, секретное кольцо для декодера и рентгеновские очки. Pdftk - это простой инструмент для повседневных дел с PDF-документами.
Вы можете создавать PDF-файлы из текста или изображений с помощью Libre Office, а затем соединять их вместе с другими PDF-файлами.
pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf
Это также может
Разделить страницы PDF в новый документ
Поворот PDF страниц или документов
и многое другое
Подробнее здесь: Ubuntu Geek: список инструментов для редактирования PDF
Попробуйте PDF цепочку:
PDF Chain - это графический интерфейс пользователя для PDF Toolkit (PDFtk). Графический интерфейс пользователя поддерживает все общие функции инструмента командной строки в удобной форме.
Вы можете установить его либо из репозиториев по умолчанию, либо получить самую последнюю версию PDF Chain PPA.
sudo apt-get install pdfchain
Или PDF Mod:
PDF Mod - это простое приложение для изменения PDF документов.
Вы можете изменять порядок, поворачивать и удалять страницы, экспортировать изображения из документа, редактировать заголовок, тему, автора и ключевые слова, а также комбинировать документы с помощью перетаскивания.
sudo apt-get install pdfmod
Смотрите также:
Для нескольких файлов в каталоге и его подкаталогах с различными расширениями я не смог найти аккуратный ответ, так что вот оно
convert -quality 85 `find -type f -name '*.png' -or -name '*.jpg' | sort -V` output.pdf
Я использовал подстановку команд, чтобы передать выбранные элементы, возвращенные find
команда в качестве аргумента convert
команда. к несчастью sort -n
неправильно отсортировал мои файлы, поэтому я попытался -V
вариант и сделал свое дело. Также заранее убедитесь, что имена ваших файлов и каталогов находятся в естественном порядке сортировки. Например dir1, dir2, dir3
не dir1, dir_2, dir3
,
Это решение, которое я использовал для преобразования нескольких файлов TIFF в PDF.
Мне пришлось создать более 6.000 PDF-файлов, начиная с 30.000 tiff. convert
Расчетное время: от 6 до 7 часов.
я использовал tiffcp
а также tiff2pdf
, они заняли несколько секунд.
$ tiffcp 1.tiff 2.tiff ... multi.tiff
$ tiff2pdf multi.tiff > final.pdf
Этот способ действительно быстрый, потому что изображения не конвертируются, а просто упаковываются.
Может быть, есть некоторые форматы TIFF, которые не так легко работают, для меня это работает отлично.
Надеюсь, поможет.
Установите Master PDF редактор. Инструмент предлагает создание, объединение и извлечение файлов PDF. Проверьте здесь для деталей о главном редакторе PDF и установке его на Ubuntu
Я не могу поверить, что никто еще не упомянул латекс (текс). Он специально разработан для создания документов и может объединять текст, изображения и PDF-файлы в "основной" документ (без какого-либо снижения качества). По сути, это полный набор библиотек и расширяемый язык разметки - он существует с давних времен и до сих пор широко используется в научном сообществе.
Технически это язык набора текста.
Добавив ответ сообщества выше, вы можете сделатьconvert 'ls *.jpg -tr'
, Принудительно заставить файл PDF иметь изображения в хронологическом порядке.
В комплекте есть ряд утилит texlive-extra-utils
завернутый в pdfjam
, Чтобы присоединиться к PDF используйте
pdfjoin -o out.pdf 1.pdf 2.pdf 3.pdf
В отличие от convert
он напрямую манипулирует в PDF, не конвертируя их в изображения.
Также на 18.04LTS (Bionic Beaver) в данный момент пакет pdftk
не поддерживается. Я бы посоветовал pdfjam
если кто-то предпочитает использовать командную строку.
Я использую PDF-Shuffler для такого рода использования, он прекрасно работает.
sudo apt-get install pdfshuffler
Это графический инструмент. Вы просто загружаете все PDF-файлы, которые хотите объединить. Вы можете изменить порядок страниц по своему усмотрению.
Попробуйте LaTeX с pdflatex
,
Я никогда не использовал его раньше, но мне потребовалось около 10 минут, чтобы начать создавать.PDF-файлы с ним, и около 40 минут, чтобы настроить их именно так, как я хотел. Я включил лучшие руководства по форматированию, которые я нашел, в конце.
sudo apt-get install pdflatex && sudo apt-get install texlive
В основном вы создаете один .tex
файл - например hello.tex
- с языком LaTeX, затем запустите pdflatex hello.tex
на этот файл, и он будет генерировать PDF. Основы языка можно найти здесь: http://www.maths.tcd.ie/~dwilkins/LaTeXPrimer/
Вот пример скелета .tex
файл:
\documentclass[a4paper,10pt]{article}
\begin{document}
{\footnotesize
YOUR TEXT HERE
YOUR TEXT HERE
}
\end{document}
Дополнительное дополнительное форматирование:
Чтобы добавить изображения: https://www.sharelatex.com/learn/Inserting_Images
Для разных размеров шрифта: https://www.sharelatex.com/learn/Font_sizes,_families,_and_styles
Для разных шрифтов: https://www.sharelatex.com/learn/Font_typefaces
Чтобы изменить размер страницы и поля при использовании pdflatex
: \usepackage[pass,paperwidth=148mm,paperheight=210mm,margin=5mm]{geometry}
1. Изображения в PDF
Инструмент, который я написал, называетсяможет объединять множество изображений в один PDF-файл. Это особенно хорошо, если вы хотите, чтобы в окончательном PDF-файле был текст с возможностью поиска, поскольку мой инструмент выполняет OCR (оптическое распознавание символов) на изображениях с помощью программы, вызываемой для объединения их в один PDF-файл.
Инструкции по установке находятся здесь: https://github.com/ElectricRCAircraftGuy/PDF2SearchablePDF#install
Поскольку это обертка вокруг
tesseract
, он принимает любой формат изображения, поддерживаемый tesseract, включая bmp, pnm, png, jfif, jpeg/jpg и tiff . Гиф не поддерживается. См. https://coptr.digipres.org/index.php/Tesseract-ocr:
Любое изображение, читаемое Leptonica, поддерживается Tesseract, включая BMP, PNM, PNG, JFIF, JPEG и TIFF. GIF не поддерживается http://www.leptonica.com/library-overview.html.
Чтобы преобразовать все изображения в PDF, они должны находиться в одной папке и больше ничего в этой папке. Итак, если у вас есть
img1.jpg
,
img2.jpg
, а также
image3.jpg
, вы можете сделать это:
# Create an `images` dir and move all images into it
mkdir -p images
mv *.jpg images # use `cp` instead of `mv` to copy instead of move the images
# Now combine all of these images into 1 pdf
pdf2searchablepdf images
Вот и все! Теперь у вас есть доступный для поиска PDF-файл с именем
images_searchable.pdf
в каталоге, в котором вы находились, когда запускали
pdf2searchablepdf
команда.
Примечание: чтобы пойти в обратном направлении и преобразовать файл PDF в набор файлов изображений , мне нравится использовать
pdftoppm
как я объясняю здесь .
Чтобы преобразовать недоступный для поиска PDF-файл с именем
input.pdf
в доступный для поиска PDF-файл с именем
input_searchable.pdf
, делать:
pdf2searchablepdf input.pdf
Видеть
pdf2searchablepdf -h
для полного меню справки, включая параметры и другие примеры.
2. Текст в PDF
3. PDF в один PDF
Для многостраничного PDF:
Конвертируйте все файлы в pdf, затем присоединитесь, используя программу записи pdf, например. pdftk, pdfill, Microsoft Print to PDF, CutePDF и т. д.
Для одностраничного PDF:
Конвертировать все файлы в изображения, например. PNG, названный в последовательности. Затем присоединитесь к одной странице с помощью конвертера изображений, например. imgconv
imgconv.exe -append *.png out2.pdf
(для вертикальной)imgconv.exe +append *.png out2.pdf
(для боком)
Могут быть некоторые конвертеры, которые могут манипулировать в других форматах или даже обрабатывать исходные форматы ввода перед выводом в pdf. Все программы, упомянутые здесь, бесплатны.
Чтобы уточнить ответ @Veles -
Использование GIMP 2.10.30 —
- Файл -> Открыть как слои...
- Выберите все изображения и нажмите «Открыть».
- Файл -> Экспортировать как...
- Изменить имя с расширением как
.pdf
- Выберите «Слои как страницы (сначала верхние слои)».
- Выберите «Изменить порядок страниц».
- Экспорт