首页 > 解决方案 > 抓取存储在网站表中的数据

问题描述

我正在尝试使用 R 的rvest包从网站上抓取表格。

该网站是:https ://www.wunderground.com/history/daily/es/san-bartolom%C3%A9/GCRR/date/2017-11-1

我通过谷歌浏览器找到了表格的选择器(检查)

#history-observation-table > tbody

我正在运行以下代码:

url <- "https://www.wunderground.com/history/daily/es/san-bartolom%C3%A9/GCRR/date/2017-11-1"

webpage <- read_html(url)

node <- html_nodes(webpage, '#history-observation-table > tbody')

data <- html_text(node)

我在尝试查看节点有什么时收到 0。

我认为表格的数据不是简单的HTML格式。可能正在使用Javascript?此外,我注意到表格页面在 2 或 3 秒后加载。起初会出现一条消息,指出没有可用的数据,然后会出现表格。

标签: rhtml-tablervest

解决方案


推荐阅读