Преобразование PDF в другой формат
Мне нужна ваша помощь, у меня есть PDF-файл, который вам нужно конвертировать в другой формат. Эти файлы содержат изображения и текст. В конце концов, нужны именно эти картинки.
Я пытался конвертировать, используя abiword, но там, к сожалению, получает только текст.
Команда, которую я использую:
abiword --to=doc file.pdf
Я думаю, что формат "odt" будет лучшим. Если это не может быть еще один способ рисовать те же картинки.
2 ответа
Если из pdf-файла нужно извлечь только несколько рисунков, вы можете использовать метод на основе графического интерфейса, который возможен только при наличии фоторедактора (вероятно, у вас установлен GIMP). Вот подробный процесс того, как это сделать (обойдитесь, если вы являетесь экспертом в этом, но это может быть полезно в качестве справки для других):
- Откройте файл PDF и поместите одно изображение на экран так, чтобы оно покрывало большую часть экрана (например, если вы используете Evince, просто нажмите F11 и отрегулируйте масштабирование). (Чем больше картинка на экране, тем лучше качество извлеченного файла)
- Нажмите клавишу печати экрана на клавиатуре.
- Выбрать
Open with: your favorite photo editor
(вероятно GIMP). - Используйте инструмент выбора прямоугольника, чтобы выбрать область изображения, которую вы хотите извлечь. Чтобы включить этот инструмент, используйте панель инструментов или нажмите клавишу " R". Как только вы выбрали область, скопируйте ее, используя Ctrl+C, и вставьте ее как новое изображение, используя Shift+Ctrl+V. Затем выберите "Экспортировать как" в меню "Файл" или нажмите Shift+Ctrl+E. Затем вы можете сохранить изображение в любом формате, который вам нравится. Просто измените расширение или выберите в меню внизу.
Если у вас есть много изображений для извлечения, или вы предпочитаете метод командной строки, используйте pdfimages
инструмент. Чтобы использовать его, установите poppler-utils
пакет (возможно, он уже есть):
sudo apt-get install poppler-utils
Затем откройте окно терминала, перейдите в папку, в которой находится pdf-файл, и запустите:
pdfimages -j file.pdf photo
Это позволит извлечь изображения из файла file.pdf и сохранить их как photo-001.jpg, photo-002.jpg и т. Д. (В той же папке, где находится файл pdf).
Откройте файл PDF с помощью OpenOffice/LibreOffice, удалите текст и сохраните файл как odt. odt означает файл "открыть текст документа". Это родной формат OpenOffice.