Есть ли инструмент для удаления всех гиперссылок из HTML-файла?
Есть ли способ сделать это в Ubuntu? Я читал, что это возможно в php, но я совсем не знаком с php.
2 ответа
Вы могли бы использовать sed
для этого, но он будет работать только для ссылок, которые находятся в одной строке в HTML-коде.
Обновить:
Чертовски жадный регулярник;) Этот должен работать сейчас!
sed -i 's|<a[^>]\+>|<a>|g' <the-html-file>
Зависит от того, что вы пытаетесь сделать:
Если у вас есть куча файлов на вашем компьютере, и вы хотите удалить ссылки, используйте что-то вроде скрипта Perl для удаления <a ...> ... </a>
теги. Вы можете удалить другие теги (или даже все теги) аналогичным образом. При правильных параметрах сопоставления с образцом этот подход может обрабатывать теги, разбитые на несколько строк. (Это очень элегантно, но детали не поместятся на полях этого поста).
Если вы пытаетесь просматривать файлы на каком-либо веб-сервере, используя Firefox (или другой браузер), вам может понадобиться какой-нибудь сценарий greasemonkey, который автоматически изменяет страницы на лету перед их отображением.