Скопируйте слово из html-файла веб-страницы, используя скрипт оболочки

Question

Скопируйте слово из html-файла веб-страницы, используя скрипт оболочки

Я пытаюсь написать сценарий оболочки, который должен сканировать веб-страницу, извлекать определенный символ / фразу из html и отображать ее. Конкретный символ означает, например, если HTML-код веб-страницы содержит фразу, скажем password:blahзатем я хочу напечатать следующий символ / слово passwordкороче хочу скрипт распечатать blah, Как я могу это сделать?

Если нужно больше объяснений, пожалуйста, спросите. Заранее спасибо!

2

scripts grep websites html

Источник

Anandu M Das 15 окт '14 в 14:26

2 ответа

Другие вопросы по тегам scripts grep websites html

Radu Rădeanu 15 окт '14 в 15:01 2014-10-15 15:01 · Answer 1 · 2014-10-15 15:01

Вам не нужен сценарий оболочки. Вероятно, вам нужна следующая составная команда:

curl -s webpage | grep -Po 'password:\K\w+'

Например, случай этой страницы работает:

curl -s http://Ask-ubuntu.ru/questions/537416/copy-a-word-from-the-html-file-of-a-web-page-using-shell-script | grep -Po 'password:\K\w+'

chaos 15 окт '14 в 14:37 2014-10-15 14:37 · Answer 2 · 2014-10-15 14:37

Нечто подобное должно работать:

wget -qO- http://website.com | grep -oP 'password:.*'

Смотрите man wget для всех вариантов. wget Можно скачать весь сайт.

0

Источник

chaos 15 окт '14 в 14:37