Есть ли какой-нибудь трюк для сбора данных с веб-страницы с использованием JavaScript и автоматической установки текущего времени и даты?

Я работаю под Ubuntu Linux в терминале, используя сценарий оболочки wget, httrackа также:

      google-chrome --headless --dump-dom 'https://www.pref.kanagawa.jp/sys/taikikanshi/kanshi/realtime/index.html' > ~/file.html

Я хочу ежечасно извлекать эти строки с вышеуказанного сайта:

      < tr class="tr_line_1">
< td class="le" id="station1" headers="stationTop" height="40px" >神奈川県< /td >
< td class="le" id="station1" headers="stationName" height="40px" >鎌倉市役所< /td >
< td class="le" headers="station1 stationDiv" height="40px">一般局 < /td >
…
< td headers="station1 WD WDUnit" height="40px">北東 < /td >
< td headers="station1 WV WVUnit" height="40px">1.2 < /td >

(Я хочу понять условия морского бриза у берегов залива Сагами. Я фанат парусного спорта и использую эти данные только для личного понимания регат.)

Спасибо за любой совет!

0 ответов

Другие вопросы по тегам