Загрузить все страницы в разделе <имя домена>/*
Предположим, у меня есть определенные страницы, например www.abc.def/ghi/a.html
, есть ли опция команды, чтобы загрузить все страницы под www.abc.def./ghi
(т.е. www.abc.def/ghi/a.html
, www.abc.def/ghi/b.html
...)?
Я установил httrack
а также webhttrack
но я не знаю, как правильно их использовать.
2 ответа
Решение
Нашел решение с httrack
и самый простой.
httrack http://www.abc.def/ghi/ -O <output-folder>
ключ в том, что по умолчанию httrack
используйте параметр -D:
может спуститься только в поддиры
Вы можете найти больше вариантов ввода httrack --help
, Вот полезная ссылка
Пытаться wget
Рекурсивная загрузка с ограничениями:
wget -r --include-directories=ghi --no-parent www.abc.def