Преобразование PDF в другой формат

Мне нужна ваша помощь, у меня есть PDF-файл, который вам нужно конвертировать в другой формат. Эти файлы содержат изображения и текст. В конце концов, нужны именно эти картинки.

Я пытался конвертировать, используя abiword, но там, к сожалению, получает только текст.

Команда, которую я использую:

abiword --to=doc file.pdf

Я думаю, что формат "odt" будет лучшим. Если это не может быть еще один способ рисовать те же картинки.

2 ответа

Решение

Если из pdf-файла нужно извлечь только несколько рисунков, вы можете использовать метод на основе графического интерфейса, который возможен только при наличии фоторедактора (вероятно, у вас установлен GIMP). Вот подробный процесс того, как это сделать (обойдитесь, если вы являетесь экспертом в этом, но это может быть полезно в качестве справки для других):

  • Откройте файл PDF и поместите одно изображение на экран так, чтобы оно покрывало большую часть экрана (например, если вы используете Evince, просто нажмите F11 и отрегулируйте масштабирование). (Чем больше картинка на экране, тем лучше качество извлеченного файла)
  • Нажмите клавишу печати экрана на клавиатуре.
  • Выбрать Open with: your favorite photo editor (вероятно GIMP).
  • Используйте инструмент выбора прямоугольника, чтобы выбрать область изображения, которую вы хотите извлечь. Чтобы включить этот инструмент, используйте панель инструментов или нажмите клавишу " R". Как только вы выбрали область, скопируйте ее, используя Ctrl+C, и вставьте ее как новое изображение, используя Shift+Ctrl+V. Затем выберите "Экспортировать как" в меню "Файл" или нажмите Shift+Ctrl+E. Затем вы можете сохранить изображение в любом формате, который вам нравится. Просто измените расширение или выберите в меню внизу.

Если у вас есть много изображений для извлечения, или вы предпочитаете метод командной строки, используйте pdfimages инструмент. Чтобы использовать его, установите poppler-utils пакет (возможно, он уже есть):

sudo apt-get install poppler-utils

Затем откройте окно терминала, перейдите в папку, в которой находится pdf-файл, и запустите:

pdfimages -j file.pdf photo

Это позволит извлечь изображения из файла file.pdf и сохранить их как photo-001.jpg, photo-002.jpg и т. Д. (В той же папке, где находится файл pdf).

Откройте файл PDF с помощью OpenOffice/LibreOffice, удалите текст и сохраните файл как odt. odt означает файл "открыть текст документа". Это родной формат OpenOffice.

Другие вопросы по тегам