首页 > 解决方案 > 在 Tripadvisor 上使用 XML R 包的带单引号的 XML 属性

问题描述

我有一个看起来像这样的 XPath 查询,带有单引号和双引号。如何正确转义撇号以便查询有效?

我试过了:

rating<- getNodeSet(doc1,"//*[(@id = "taplc_location_reviews_list_apd_0")]//*[contains(concat( " ", @class, " " ), concat( " ", "ui_bubble_rating", " " ))]" 

如何使用此 Xpath 以便能够从 Tripadvisor 获取评分?

它给出了一个错误:

错误:“rating<-getNodeSet(doc1,"//*[(@id = "taplc_location_reviews_list_apd_0"

标签: rxmlweb-scraping

解决方案


尝试将 xpath 中的双引号替换为单引号(但在 xpath 周围保留双引号),如下所示:

rating<- getNodeSet(doc1,"//[(@id = 'taplc_location_reviews_list_apd_0')]//[contains(concat( ' ', @class, ' ' ), concat( ' ', 'ui_bubble_rating', ' ' ))]"

推荐阅读