Как экспортировать страницы из браузера со встроенными гиперссылками?
Сделал печальное открытие сегодня. У меня есть Ubuntu 10.04 LTS. Моя клиентка работает в рекламном бизнесе, и у меня была задача по маркетингу для меня. Она хотела, чтобы я посещал сайты конкурентов и экспортировал домашние страницы в формате PDF. Однако она хотела, чтобы я делал это с помощью встроенных гиперссылок.
Как выясняется, Firefox (и даже последний Chrome) в Ubuntu 10.04 LTS не встраивают гиперссылки в экспорт PDF-страниц.
Несомненно, есть несколько плагинов Chrome и FF, которые позволяют экспортировать в формате PDF, но они делают это для удаленного подключения к URL-адресу, создания PDF-файла и последующей принудительной загрузки в браузере для его загрузки из удаленного местоположения. Это не очень хорошо для меня, потому что некоторые из этих страниц конкурентов требуют первоначального входа в систему. Это означает, что все, что я возвращаю к печати PDF из этих плагинов FF или Chrome, - это страница входа.
Есть ли способ обойти эту проблему, чтобы исправить испорченный принтер PDF на Ubuntu 10.04?
1 ответ
Используемый инструмент называется wkhtmltopdf, этот инструмент находится в репозиториях, но все версии скомпилированных репозиториев не имеют встроенной функции связи из-за хакерских изменений в некоторых библиотеках qt.
Так что установите wkhtmltopdf из репозиториев, чтобы получить все зависимости:
sudo apt-get install wkhtmltopdf
Тогда скачайте статическую версию отсюда. Распакуйте файл на рабочий стол и перейдите в bin:
sudo mv Desktop/wkhtmltopdf-i386 /usr/bin/wkhtmltopdf-static
Теперь вы можете использовать инструмент для создания PDF-файлов со ссылками:
wkhtmltopdf-static http://google.com google.pdf
Для ваших веб-сайтов с требованием входа в систему вам необходимо войти через firefox, а затем экспортировать файл cookie с помощью плагина Export Cookies firefox. С cookies.txt вы можете запустить:
wkhtmltopdf-static --cookie-jar cookies.txt http://google.com google.pdf
Я знаю, что многие из них должны быть выполнены в командной строке, но это лучший способ сделать это, и вы получите гораздо больший контроль. wkhtmltopdf - довольно мощный инструмент.