python - 如何排除总跨度标签,即我只想排除此 p 标签跨度标签内的 p 标签中的文本
问题描述
我需要使用scrapy代码在p标签内排除span标签内的文本。
我在图像中附加了 html 路径,请找到它并帮助我。
response.xpath('//*[@id="post-55812"]/div/p').not(span::text).extract()
错误:
File "<console>", line 1
response.xpath('//*[@id="post-55812"]/div/p').not(span::text).extract()[1:11]))
^
SyntaxError: invalid syntax
解决方案
这应该工作
response.css('#post-55812 > div > p:not(span)').extract()
推荐阅读
- java - 使用 Oauth 2 对服务器进行身份验证/自动化的最佳方法是什么?
- mysql - 查找行的百分比mysql查询
- uwp - Hololens 2 上的 MediaPlayer 和 MediaStreamSource
- php - MySQL 仅在字段为空或 NULL 时更新字段
- react-native - 嵌套屏幕上“ModalPresentationIOS”类型的反应导航器模式具有不稳定的行为
- pandas - 如何根据单列值动态更新熊猫中的两列?
- python - 如何在python中将具有多个部分的段落转换为json?
- javascript - 如何在同一台服务器上同时发出 HTTP 和 Websocket 请求?
- java - Spring Boot Repository - 直接从数据库加载 DTO
- asynchronous - 为什么 async-std 的 task::spawn 会阻止后续代码行执行?