r - 为什么我无法使用 rvest 提取此表?
问题描述
我试图从这个网站上提取按地区和股东分列的销售信息。
我尝试使用 rvest,但结果提取的表是空的。除了使用 RSelenium 之外,还有其他方法吗?
library(dplyr)
library(tidyverse)
library(rvest)
url <- "https://www.marketscreener.com/ZURICH-INSURANCE-GROUP-2955923/company/"
wahis.session <- html_session(url)
r1 <- wahis.session %>%
html_nodes(xpath = '//*[@id="zbCenter"]/div/span/table[4]/tbody/tr[2]/td[1]/table[3]/tbody/tr[2]/td/table') %>%
html_table(fill = TRUE)
r2 <- wahis.session %>%
html_nodes(xpath = '//*[@id="XLT27Z-S-CH"]') %>%
html_table(fill = TRUE)
解决方案
如果您不想使用xpath
,您可以列出所有表格,html_nodes("table")
然后选择您需要的表格。但是,如果页面中有很多所需的表,则可能有点难以找到所需的表,这里就是这种情况:
library(rvest)
library(dplyr)
url <- "https://www.marketscreener.com/ZURICH-INSURANCE-GROUP-2955923/"
tables <- read_html(url) %>%
html_nodes("table")
# Ex: 'Quotes 5-day view' table
tables[26] %>%
html_table(fill = T)
推荐阅读
- python - 将 tqdm 与子进程一起使用
- c# - HttpClient - 不返回正文内容?
- php - 将 HTML 标记转换为 Excel 的基本格式文本
- javascript - 设置间隔;歌曲节拍的毫秒数,等式
- javascript - 为什么 PAGE CSS 不起作用?
- c# - Xamarin Forms 放大 在 Web 视图中缩小 不能顺利工作
- css - 将已定义的 CSS 添加到另一个 CSS
- python - 如何突出显示 Text Tk() 中的某些单词
- android - 哪个android数据库可以确保安全性和较小的数据库文件大小?
- android - kotiln- 类不是抽象的,不实现抽象基类成员(RecyclerView)