wget: сайт паука и проверка внешних ссылок
Folks,
Я пытаюсь использовать wget для создания списка URL-адресов сайта, а также для проверки неработающих ссылок.
Вот моя проблема: я хочу, чтобы wget проверял ссылки на внешние сайты, но больше не обрабатывает эти ссылки.
То есть, если я сопоставляю www.example.com, и любая из страниц в этом домене содержит ссылку на страницу в другом домене (например, " http://example.net/document.html"), я хотите, чтобы wget проверил, что такой документ существует, но не обрабатывает его больше (т. е. не следует переходить по ссылкам в этом документе).
Любые подсказки, как этого добиться?
Спасибо! Фернандо