首页 > 解决方案 > XPATH 以文本嵌套标签为目标

标签

问题描述

我正在尝试将文本定位在

标签。有一些

也有嵌套标签的标签,而我的 XPATH 没有针对这些标签的文本值。

链接:https ://help.lyft.com/hc/en-us/articles/115012925707-I-was-charged-incorrectly

这是我正在使用的 XPATH://article//p/text()

当然,我可以do //article//p//text()将文本作为目标,但这也会得到我不想提取的其他链接。我只想获取 a 中的所有文本

标记,如果有任何嵌套标记,也取该值。

我怎样才能达到这样的结果?

在此处输入图像描述

感谢大家。

标签: pythonxpathweb-scrapingscrapy

解决方案


由于大多数粉红色的链接都以Learn开头,我可能会这样:

a = response.xpath('//article//p//a//text()').extract()
if "Learn" not in a and "Back to top" not in a:
    print(response.xpath('//article//p/text()').extract())

推荐阅读