Скопируйте слово из html-файла веб-страницы, используя скрипт оболочки

Я пытаюсь написать сценарий оболочки, который должен сканировать веб-страницу, извлекать определенный символ / фразу из html и отображать ее. Конкретный символ означает, например, если HTML-код веб-страницы содержит фразу, скажем password:blahзатем я хочу напечатать следующий символ / слово passwordкороче хочу скрипт распечатать blah, Как я могу это сделать?

Если нужно больше объяснений, пожалуйста, спросите. Заранее спасибо!

2 ответа

Вам не нужен сценарий оболочки. Вероятно, вам нужна следующая составная команда:

curl -s webpage | grep -Po 'password:\K\w+'

Например, случай этой страницы работает:

curl -s http://Ask-ubuntu.ru/questions/537416/copy-a-word-from-the-html-file-of-a-web-page-using-shell-script | grep -Po 'password:\K\w+'

Нечто подобное должно работать:

wget -qO- http://website.com | grep -oP 'password:.*'

Смотрите man wget для всех вариантов. wget Можно скачать весь сайт.

Другие вопросы по тегам