首页 > 解决方案 > 如何使用 XPath 提取与给定模式不匹配的项目?

问题描述

我正在将一些带有scrapy的图像拉入python列表。有些图像是占位符,可以通过 URL 识别。所以我想检查我的 xpath 命令中的特定字符串,如果匹配则跳过此图像。

images = response.xpath('//meta[@property="og:image"]/@content').extract()[0:3]

我想排除所有匹配项:.*Demo_600x600.* 如何使用 xpath 执行此操作?

标签: pythonxmlxpathscrapy

解决方案


这个 XPath,

//meta[@property="og:image"][not(contains(@content, "Demo_600x600"))]/@content

将选择那些@content值不包含Demo_600x600子字符串的属性。


推荐阅读