首页 > 解决方案 > html_table 无法识别我的节点通行证,尽管它是一个表格

问题描述

包的新功能rvest.. 我正在尝试提取此处看到的表格,其中包含田径比赛的结果。

https://www.decathlon2000.com/720/gotzis-2000/

基本rvest利用似乎是将 url 传递给read_html,然后使用“Selectorgadget”js 小书签选择相关的 css 选择器,然后将其插入到html_nodes,我已经完成了。

gotzis2000 <- read_html("https://www.decathlon2000.com/720/gotzis-2000/")

gotzis2000 %>% html_nodes("#articlecontent td")

但是,当我尝试然后将其输入html_table

gotzis2000 %>% html_nodes("#articlecontent td") %>% html_table()

我得到错误Error: html_name(x) == "table" is not TRUE

当我使用 管道进行上述操作时html_text,我可以看到数据已被提取,因此我不确定此处的正确程序是什么。

标签: rrvest

解决方案


推荐阅读