Есть ли какой-нибудь трюк для сбора данных с веб-страницы с использованием JavaScript и автоматической установки текущего времени и даты?
Я работаю под Ubuntu Linux в терминале, используя сценарий оболочки
wget
,
httrack
а также:
google-chrome --headless --dump-dom 'https://www.pref.kanagawa.jp/sys/taikikanshi/kanshi/realtime/index.html' > ~/file.html
Я хочу ежечасно извлекать эти строки с вышеуказанного сайта:
< tr class="tr_line_1">
< td class="le" id="station1" headers="stationTop" height="40px" >神奈川県< /td >
< td class="le" id="station1" headers="stationName" height="40px" >鎌倉市役所< /td >
< td class="le" headers="station1 stationDiv" height="40px">一般局 < /td >
…
< td headers="station1 WD WDUnit" height="40px">北東 < /td >
< td headers="station1 WV WVUnit" height="40px">1.2 < /td >
(Я хочу понять условия морского бриза у берегов залива Сагами. Я фанат парусного спорта и использую эти данные только для личного понимания регат.)
Спасибо за любой совет!