Скопируйте слово из html-файла веб-страницы, используя скрипт оболочки
Я пытаюсь написать сценарий оболочки, который должен сканировать веб-страницу, извлекать определенный символ / фразу из html и отображать ее. Конкретный символ означает, например, если HTML-код веб-страницы содержит фразу, скажем password:blah
затем я хочу напечатать следующий символ / слово password
короче хочу скрипт распечатать blah
, Как я могу это сделать?
Если нужно больше объяснений, пожалуйста, спросите. Заранее спасибо!
2 ответа
Вам не нужен сценарий оболочки. Вероятно, вам нужна следующая составная команда:
curl -s webpage | grep -Po 'password:\K\w+'
Например, случай этой страницы работает:
curl -s http://Ask-ubuntu.ru/questions/537416/copy-a-word-from-the-html-file-of-a-web-page-using-shell-script | grep -Po 'password:\K\w+'
Нечто подобное должно работать:
wget -qO- http://website.com | grep -oP 'password:.*'
Смотрите man wget для всех вариантов. wget
Можно скачать весь сайт.