python - 如何使用 XPath 提取与给定模式不匹配的项目?
问题描述
我正在将一些带有scrapy的图像拉入python列表。有些图像是占位符,可以通过 URL 识别。所以我想检查我的 xpath 命令中的特定字符串,如果匹配则跳过此图像。
images = response.xpath('//meta[@property="og:image"]/@content').extract()[0:3]
我想排除所有匹配项:.*Demo_600x600.*
如何使用 xpath 执行此操作?
解决方案
这个 XPath,
//meta[@property="og:image"][not(contains(@content, "Demo_600x600"))]/@content
将选择那些@content
值不包含Demo_600x600
子字符串的属性。
推荐阅读
- http - 使用单个 HTTP Post 连接在块中发送数据
- c# - 检查 DateTime 在 Linq Where 子句中是否有效
- postman - Postman - 如何获取url(Query Params)中传递的参数和值进行验证?
- c++ - 为什么在 C++ 中使用 [] 时,作为映射值的对象需要有一个空/默认构造函数?
- python - 使用请求通过 http 协议将设置发送到 clickhouse
- c - 不需要的指针修改
- python - 我想编写一个for循环,在一个条件下向字典添加一个新键,购买次数必须> = 3
- powerapps - Power Apps DataVerse 导入映射问题
- java - Junit 使用 Liquibase API 测试 Liquibase .yaml - 将 .yaml 文件解析为 Java 对象
- javascript - 如何在javascript中的for循环中获取下一个元素