Как я могу получить текст заметок в ppt-файле через unoconv?
Я хотел бы получить текст заметок для отдельных слайдов в PPT в легкодоступном формате на моем компьютере с Linux (Ubuntu 12.04).
Моя цель - преобразовать слайды PPT в файлы изображений с метаданными, заметками в виде метаданных.
Я сделал до преобразования PPT в изображения с помощью команд unoconv & convert,
Первоначально я преобразовал PPT в PDF с помощью следующей команды,
sudo unoconv -f pdf -o output.pdf input.pptx
Во-вторых, конвертируйте эти PDF-файлы в PNG-файлы, используя следующую команду:
convert output.pdf -density 400 -quality 100 -sharpen 0x1.0 output_%01d.png
Теперь мне нужно получить заметки из этого,
Я попытался преобразовать PPT в xhtml, чтобы получить заметки, используя следующую команду unoconv,
sudo unoconv -f xhtml -o output.xhtml input.pptx
Но в приведенном выше, можно читать заметки, но нет способа разобрать его по коду, это не в правильной структуре.
Может ли кто-нибудь помочь мне получить заметки из этого?
Заранее спасибо.