r - 抓取存储在网站表中的数据
问题描述
我正在尝试使用 R 的rvest包从网站上抓取表格。
该网站是:https ://www.wunderground.com/history/daily/es/san-bartolom%C3%A9/GCRR/date/2017-11-1
我通过谷歌浏览器找到了表格的选择器(检查)
#history-observation-table > tbody
我正在运行以下代码:
url <- "https://www.wunderground.com/history/daily/es/san-bartolom%C3%A9/GCRR/date/2017-11-1"
webpage <- read_html(url)
node <- html_nodes(webpage, '#history-observation-table > tbody')
data <- html_text(node)
我在尝试查看节点有什么时收到 0。
我认为表格的数据不是简单的HTML格式。可能正在使用Javascript?此外,我注意到表格页面在 2 或 3 秒后加载。起初会出现一条消息,指出没有可用的数据,然后会出现表格。
解决方案
推荐阅读
- javascript - 如何在 vue.js 中的 v-if 中使用 toLowerCase()?
- spring-boot - 在 Spring boot / Thymeleaf 中传递变量
- sql - 使用订单删除或减去库存中的库存
- node.js - zlib.createGunzip 在读取 gzip 文件时给出 Z_BUF_ERROR
- elasticsearch - ElasticSearch如何突出嵌套对象中的搜索?
- c# - SGML 格式问题
- javascript - 如何编写一个 JavaScript 函数,从字符串中提取多个字符(从字符串的开头)?
- spring-boot - Spring Scheduler 在一天的不同时间运行
- git - GitHub新令牌系统
- visual-studio - 如何将 cmake 创建的自定义规则转换为 VS 自定义构建?