r - 网页抓取、选择器小工具和 rvest 的问题
问题描述
我对网络抓取相当陌生,目前正在努力处理下一页的表格:
https://www.ggesports.com/en-us/stats/lol/global/Team
我测试了从表格外的网站抓取文本,这没有问题,但是当我尝试抓取表格的一列时,它只返回输出“字符(0)”。
我使用选择器小工具来识别特定的 CSS 选择器。之后我到目前为止尝试过:
library(rvest)
library(dplyr)
url <- "https://www.ggesports.com/en-us/stats/lol/global/Team"
Stats <- read_html(url)
Name <- hot100 %>%
rvest::html_nodes('body') %>%
xml2::xml_find_all("//span[contains(@class, 'team-name')]") %>%
rvest::html_text()
Name
# and
Name_html <- html_nodes(Stats,'.team-name')
Name <- html_text(Name_html)
Name
我将不胜感激任何帮助。提前感谢任何人!
解决方案
数据是从您可以在网络选项卡中找到的另一个端点动态提取的。向该端点发出请求:
library(jsonlite)
data <- jsonlite::read_json('https://www.ggesports.com/en-us/stats/lol/global/Team/GetRankingList?season=-1&name=®ionId=50', simplifyVector = T)
推荐阅读
- javascript - 有没有办法更改本地存储中的键名。例如:
- python - 为什么 cross_val_score 与我手动计算时不同?
- google-chrome - 桌面谷歌浏览器拼写检查是否受操作系统影响?
- httpwebresponse - How to fix Veracode error "Server-Side Request Forgery (SSRF)" when using HttpWebResponse?
- android - React-Native Error: Unable to resolve module
- computer-vision - 立体系统中的三角测量导致的深度误差
- html - 至少 3 个单词或更多,但使用阿拉伯语 [HTML 模式]
- python - 在多字串的空格之间添加一个字符
- c - C 一个无符号整数怎么可能只占用两个字节?
- javascript - regex for only lowercase letters and underscore