Разделение страницы PDF на две части
У меня есть файл PDF, который был результатом сканирования книги.
В этом файле 2 страницы книги соответствуют 1 в PDF. Поэтому, когда я вижу страницу в файле PDF, я на самом деле вижу 2 страницы книги.
( оригинал)
Я хотел бы знать, есть ли какой-либо способ преобразовать этот файл в другой PDF, где 1 страница книги соответствует 1 странице PDF, то есть нормальной ситуации.
9 ответов
Попробуйте Gscan2pdf, который можно загрузить из Центра программного обеспечения или установить из командной строки. sudo apt-get install gscan2pdf
,
Открыть Gscan2Pdf:
файл> импортировать файл PDF;
Теперь у вас есть одна страница (см. Левую колонку):
затем инструменты> очистить;
выберите double как layout и #output pages как 2, затем нажмите OK;
Gscan2pdf разбивает ваш документ (помимо прочего, он также очищает его, выравнивает и т. Д.) Теперь у вас есть две страницы:
- Сохраните файл PDF, если вы удовлетворены результатом.
Спасибо @marttt и их ответу в Unix & Linux.
Ты можешь использовать mutool
(который является частью mupdf
):
mutool poster -x 2 input.pdf output.pdf
Вы также можете использовать -y
если вы хотите выполнить вертикальное разделение.
Я бы использовал Briss. Это позволяет вам выбирать различные области каждой страницы, каждая из которых превращается в новую страницу.
Другим вариантом является ScanTailor. Эта программа особенно хорошо подходит для обработки нескольких сканов одновременно.
apt-get install scantailor
К сожалению, он работает только при вводе файлов изображений, но достаточно просто конвертировать отсканированный PDF в jpg. Вот одна строка, которую я использовал для преобразования целого каталога PDF-файлов в jpgs. Если PDF имеет n страниц, он создает n jpg файлов.
for f in ./*.pdf; do gs -q -dSAFER -dBATCH -dNOPAUSE -r300 -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -sDEVICE=png16m "-sOutputFile=$f%02d.png" "$f" -c quit; done;
У меня были скриншоты, готовые поделиться, но у меня недостаточно представителей, чтобы опубликовать их.
ScanTailor выводит в tif, поэтому, если вы хотите, чтобы файлы вернулись в PDF, вы можете использовать это, чтобы сделать PDF для каждой страницы.
for f in ./*.tif; do tiff2pdf "$f" -o "$f".pdf -p letter -F; done;
Затем вы можете использовать этот однострочник или приложение, такое как PDFShuffler, чтобы объединить любой или все файлы в один PDF.
gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf *.pdf
Решение командной строки с использованием ImageMagick:
Разделите PDF на отдельные изображения:
convert -density 300 orig.pdf page.png
Разделите изображения каждой страницы на левое и правое изображение:
for file in page-*.png; do convert "$file" -crop 50%x100% "$file-split.png"; done
Переименовать
page-###-split-#.png
файлы просто001.png
,002.png
так далее.:ls page-*-split-*.png | cat -n | while read n f; do mv "$f" $(printf "%03d.png" $n); done
Снова объедините полученные изображения страниц в PDF:
convert ls -l [0-9][0-9][0-9].png result.pdf
Источники: (также включая варианты и дополнительные советы)
Обрезать и разделить сканирование книги в 3 команды, здесь изменено, чтобы использовать
for
команда цикла, чтобы предотвратить проблемы с памятью.Ответ: Переименование файлов в папке с последовательными номерами вместе с этим комментарием
Ответ: ImageMagick: конвертирование завершается после нескольких страниц, если вы работаете с ограничениями памяти ImageMagick (что я и сделал).
Вот скрипт Python для этого.
Сейда может сделать это, используя свой веб-интерфейс или интерфейс командной строки (с открытым исходным кодом). Задача называется splitdownthemiddle
Вы можете использовать Okular или любой PDF-ридер, а затем использовать печать для файла и выберите параметры и копии-> страниц. Выберите интересующие вас страницы и распечатайте их. Это будет вырезать выбранные страницы. Просто и легко!
Есть замечательная программа сканкромсатор. Это бесплатно и хорошо работает через вино. Больше информации здесь.