scrapy - 需要帮助以找到一种使用 xpath() 从头部获取某些东西的方法 [已解决]
问题描述
我知道如何获取 response.xpath('//head/script').getall()
问题是我必须从列表中获取一个特殊的脚本并且无法找到如何去做。该列表是随机的,所以不能只说 list_foo[foo1] 因为它交换了它的位置 http 头看起来像这样
头 链接 rel="规范" href="/ 元名称=“机器人”内容=“无存档”/ 脚本数据脚本="TagManagerDataLayer" .... /script 脚本数据脚本="TagManagerScript" .... /script 脚本 ... /脚本 脚本 var item={} /脚本 脚本 ... /脚本 /头
我需要刮掉“var item={}”
解决方案
您可以尝试这样的操作: //script[contains(., "var item={}")]
推荐阅读
- python - 在循环后缺少段落之间的空格?
- python - 如何从 tkinter 表中选择某些数据点并将它们分配给变量
- r - 在 R 中复制行并创建新变量
- python - 如何使程序一一加载 glob 中的所有文本文件?
- python - 如何使用带有 Pandas 数据集的 Seaborn 修复 Barplot 错误(它不会让我用 barplot 我的变量)
- latex - 如何使用 pandoc 创建带有目录或标题内部分链接的 PDF
- javascript - 为什么我应该在此处包含 return ?
- php - 从子域向域发送 POST 请求时出现错误 419
- mysql - 如何在 MYSQL 的另一个表中获取项目数组及其关联值的列表?
- reactjs - 如何在 React 中进行条件构建?