wget: сайт паука и проверка внешних ссылок

Folks,

Я пытаюсь использовать wget для создания списка URL-адресов сайта, а также для проверки неработающих ссылок.

Вот моя проблема: я хочу, чтобы wget проверял ссылки на внешние сайты, но больше не обрабатывает эти ссылки.

То есть, если я сопоставляю www.example.com, и любая из страниц в этом домене содержит ссылку на страницу в другом домене (например, " http://example.net/document.html"), я хотите, чтобы wget проверил, что такой документ существует, но не обрабатывает его больше (т. е. не следует переходить по ссылкам в этом документе).

Любые подсказки, как этого добиться?

Спасибо! Фернандо

0 ответов

Другие вопросы по тегам