首页 > 解决方案 > 如何修复:将 xpath 复制到脚本后出现意外标记

问题描述

我正在尝试从网站上抓取公司描述。要访问公司描述,您必须单击公司名称,该站点会将您定向到特定于给定公司的另一个页面。为了设置这个循环,我需要复制 x 路径,但是我遇到了语法问题,因为我遇到了意外的令牌错误。我是编码新手,所以请尽可能简单地回答。

number <- c(156000:165000)
description <- NULL
for(i in 1:949){
  url <- paste0("https://congress.nsc.org/nsc2019/public/eBooth.aspx?IndexInList=0&FromPage=Exhibitors.aspx&ParentBoothID=&ListByBooth=true&BoothID=", 
                number[i])

description[i] <- url %>%
  read_html() %>% 
  html_nodes(xpath = paste(//*[@id="eboothContainer"]/p)) %>% 
  html_text()

}

标签: rxpath

解决方案


更改以下行

html_nodes(xpath = paste(//*[@id="eboothContainer"]/p)) %>%  # <== incorrect

如下

html_nodes(xpath = "//*[@id='eboothContainer']/p") %>% # <== correct

刚刚调整了xpath和代码行。


推荐阅读