首页 > 解决方案 > 如何排除总跨度标签,即我只想排除此 p 标签跨度标签内的 p 标签中的文本

问题描述

在此处输入图像描述

我需要使用scrapy代码在p标签内排除span标签内的文本。

我在图像中附加了 html 路径,请找到它并帮助我。

response.xpath('//*[@id="post-55812"]/div/p').not(span::text).extract()

错误:

  File "<console>", line 1
    response.xpath('//*[@id="post-55812"]/div/p').not(span::text).extract()[1:11]))
                                                    ^
SyntaxError: invalid syntax

标签: pythonxpathweb-scrapingscrapyweb-crawler

解决方案


这应该工作

response.css('#post-55812 > div > p:not(span)').extract()

推荐阅读