python-3.x - 如何在scrapy中按顺序导出标签的文本
问题描述
解决方案
尝试以下 XPath 以获取p
排除文本节点的所有后代文本节点a
:
//p[@class="title"]//text()[not(parent::a)]
PS如果链接看起来像<a href="#">something <b>bold</b> inside</a>
你可能需要替换(parent::a)
为(ancestor::a)
推荐阅读
- php - 使用 cookie 将信息存储在愿望清单和购物车中 ($_COOKIE)
- regex - 正则表达式来分隔子句的键、运算符和值组
- python - 为什么 list.copy() 方法很浅?
- python - 将 Discord 机器人部署到 heroku 时的状态 0
- parse-platform - Parse Server - JS - 查询返回 Observable
- fortran - 如何将命令行输入发送到 Fortran 子例程?
- amazon-web-services - eksctl - 托管组中的安全组
- templates - 我需要根据英国立法改善我的谷歌网站的可访问性
- wordpress - manage_[post_type]_posts_custom_column 没有通过`$post_id`
- scala - How to do a case insensitive match for command line arguments in scala?