r - 如何修复:将 xpath 复制到脚本后出现意外标记
问题描述
我正在尝试从网站上抓取公司描述。要访问公司描述,您必须单击公司名称,该站点会将您定向到特定于给定公司的另一个页面。为了设置这个循环,我需要复制 x 路径,但是我遇到了语法问题,因为我遇到了意外的令牌错误。我是编码新手,所以请尽可能简单地回答。
number <- c(156000:165000)
description <- NULL
for(i in 1:949){
url <- paste0("https://congress.nsc.org/nsc2019/public/eBooth.aspx?IndexInList=0&FromPage=Exhibitors.aspx&ParentBoothID=&ListByBooth=true&BoothID=",
number[i])
description[i] <- url %>%
read_html() %>%
html_nodes(xpath = paste(//*[@id="eboothContainer"]/p)) %>%
html_text()
}
解决方案
更改以下行
html_nodes(xpath = paste(//*[@id="eboothContainer"]/p)) %>% # <== incorrect
如下
html_nodes(xpath = "//*[@id='eboothContainer']/p") %>% # <== correct
刚刚调整了xpath和代码行。
推荐阅读
- prometheus - Prometheus 每天查询不在 24 小时“桶”中
- apache-kafka - 哪个 JMX Metrics 提供了 kafka 集群的运行状况?
- python - 将一行中的字符串与所有其他行中的相同字符串进行比较,并记录差异,pandes 的性能问题
- c - M4 皮质中的观察点
- javascript - 使用 chrome 暂停下载无法按预期工作
- c++ - 一个数中 x 的倍数
- javascript - 通过css类名获取JS中的CSS属性
- c# - 使用 NEST 进行弹性搜索。如何根据孩子属性搜索父母
- php - 是否可以在 php 中将 React 与材料 ui 一起使用?
- c - 使用 strcat 在单个字符串中复制 n 个单词