python - XPATH 以文本嵌套标签为目标标签
问题描述
我正在尝试将文本定位在
标签。有一些
也有嵌套标签的标签,而我的 XPATH 没有针对这些标签的文本值。
链接:https ://help.lyft.com/hc/en-us/articles/115012925707-I-was-charged-incorrectly
这是我正在使用的 XPATH://article//p/text()
当然,我可以do //article//p//text()
将文本作为目标,但这也会得到我不想提取的其他链接。我只想获取 a 中的所有文本
标记,如果有任何嵌套标记,也取该值。
我怎样才能达到这样的结果?
感谢大家。
解决方案
由于大多数粉红色的链接都以Learn开头,我可能会这样:
a = response.xpath('//article//p//a//text()').extract()
if "Learn" not in a and "Back to top" not in a:
print(response.xpath('//article//p/text()').extract())
推荐阅读
- angular2-aot - Spartacus 在生产模式 (AOT) 下部分呈现页面
- keycloak - 使用 keycloak 作为多租户应用程序的 IDP 代理
- perl - 我无法在 Perl 中使用 Socket 赢得横幅
- java - 在 Kotlin 中将日期字符串转换为所需的格式
- sql - 如何仅在一个 PostgreSQL 触发器函数中删除事务中的行
- angular - 带有 REST 后端的 Angular 前端:CRUD 操作的实体设计
- python - 如何从 html 的 2 个标签中提取文本或替换第一个和最后一个标签
- solidity - 错误
.append() in ton-solidity:左侧 (1) 与右侧 (0) 的组件数量不同 - node.js - AWS Elastic Beanstalk NPM 部署错误
- javascript - 如何在 Highchart 类型的日期时间上设置固定的最大 x 轴