Разделение страницы PDF на две части

У меня есть файл PDF, который был результатом сканирования книги.

В этом файле 2 страницы книги соответствуют 1 в PDF. Поэтому, когда я вижу страницу в файле PDF, я на самом деле вижу 2 страницы книги.

введите описание здесь

( оригинал)

Я хотел бы знать, есть ли какой-либо способ преобразовать этот файл в другой PDF, где 1 страница книги соответствует 1 странице PDF, то есть нормальной ситуации.

9 ответов

Решение

Попробуйте Gscan2pdf, который можно загрузить из Центра программного обеспечения или установить из командной строки. sudo apt-get install gscan2pdf,

Открыть Gscan2Pdf:

  1. файл> импортировать файл PDF;

    Импортировать

    Теперь у вас есть одна страница (см. Левую колонку):

    не замужем

  2. затем инструменты> очистить;

    убирать

  3. выберите double как layout и #output pages как 2, затем нажмите OK;

    Трещина

  4. Gscan2pdf разбивает ваш документ (помимо прочего, он также очищает его, выравнивает и т. Д.) Теперь у вас есть две страницы:

    двойной

  5. Сохраните файл PDF, если вы удовлетворены результатом.

Спасибо @marttt и их ответу в Unix & Linux.

Ты можешь использовать mutool (который является частью mupdf):

mutool poster -x 2 input.pdf output.pdf

Вы также можете использовать -y если вы хотите выполнить вертикальное разделение.

Я бы использовал Briss. Это позволяет вам выбирать различные области каждой страницы, каждая из которых превращается в новую страницу.

введите описание здесь

Другим вариантом является ScanTailor. Эта программа особенно хорошо подходит для обработки нескольких сканов одновременно.

apt-get install scantailor

К сожалению, он работает только при вводе файлов изображений, но достаточно просто конвертировать отсканированный PDF в jpg. Вот одна строка, которую я использовал для преобразования целого каталога PDF-файлов в jpgs. Если PDF имеет n страниц, он создает n jpg файлов.

for f in ./*.pdf; do gs -q -dSAFER -dBATCH -dNOPAUSE -r300 -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -sDEVICE=png16m "-sOutputFile=$f%02d.png" "$f" -c quit; done;

У меня были скриншоты, готовые поделиться, но у меня недостаточно представителей, чтобы опубликовать их.

ScanTailor выводит в tif, поэтому, если вы хотите, чтобы файлы вернулись в PDF, вы можете использовать это, чтобы сделать PDF для каждой страницы.

for f in ./*.tif; do tiff2pdf "$f" -o "$f".pdf -p letter -F; done;

Затем вы можете использовать этот однострочник или приложение, такое как PDFShuffler, чтобы объединить любой или все файлы в один PDF.

gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf *.pdf

Решение командной строки с использованием ImageMagick:

  1. Разделите PDF на отдельные изображения:

    convert -density 300 orig.pdf page.png
    
  2. Разделите изображения каждой страницы на левое и правое изображение:

    for file in page-*.png;
      do convert "$file" -crop 50%x100% "$file-split.png";
    done
    
  3. Переименовать page-###-split-#.png файлы просто 001.png, 002.png так далее.:

    ls page-*-split-*.png | cat -n | 
      while read n f; do mv "$f" $(printf "%03d.png" $n); done
    
  4. Снова объедините полученные изображения страниц в PDF:

    convert ls -l [0-9][0-9][0-9].png result.pdf
    

Источники: (также включая варианты и дополнительные советы)

Вот скрипт Python для этого.

https://gist.github.com/tshrinivasan/23d8e4986cbae49b8a8c

Сейда может сделать это, используя свой веб-интерфейс или интерфейс командной строки (с открытым исходным кодом). Задача называется splitdownthemiddle

Вы можете использовать Okular или любой PDF-ридер, а затем использовать печать для файла и выберите параметры и копии-> страниц. Выберите интересующие вас страницы и распечатайте их. Это будет вырезать выбранные страницы. Просто и легко!

Есть замечательная программа сканкромсатор. Это бесплатно и хорошо работает через вино. Больше информации здесь.

Другие вопросы по тегам