Есть ли инструмент для удаления всех гиперссылок из HTML-файла?

Есть ли способ сделать это в Ubuntu? Я читал, что это возможно в php, но я совсем не знаком с php.

2 ответа

Решение

Вы могли бы использовать sed для этого, но он будет работать только для ссылок, которые находятся в одной строке в HTML-коде.

Обновить:

Чертовски жадный регулярник;) Этот должен работать сейчас!

sed -i 's|<a[^>]\+>|<a>|g' <the-html-file>

Зависит от того, что вы пытаетесь сделать:

Если у вас есть куча файлов на вашем компьютере, и вы хотите удалить ссылки, используйте что-то вроде скрипта Perl для удаления <a ...> ... </a> теги. Вы можете удалить другие теги (или даже все теги) аналогичным образом. При правильных параметрах сопоставления с образцом этот подход может обрабатывать теги, разбитые на несколько строк. (Это очень элегантно, но детали не поместятся на полях этого поста).

Если вы пытаетесь просматривать файлы на каком-либо веб-сервере, используя Firefox (или другой браузер), вам может понадобиться какой-нибудь сценарий greasemonkey, который автоматически изменяет страницы на лету перед их отображением.

Другие вопросы по тегам