首页 > 解决方案 > 需要帮助以找到一种使用 xpath() 从头部获取某些东西的方法 [已解决]

问题描述

我知道如何获取 response.xpath('//head/script').getall()

问题是我必须从列表中获取一个特殊的脚本并且无法找到如何去做。该列表是随机的,所以不能只说 list_foo[foo1] 因为它交换了它的位置 http 头看起来像这样

    头
    链接 rel="规范" href="/
    元名称=“机器人”内容=“无存档”/
    脚本数据脚本="TagManagerDataLayer" .... /script
    脚本数据脚本="TagManagerScript" .... /script
    脚本 ... /脚本
    脚本 var item={} /脚本
    脚本 ... /脚本
    /头

我需要刮掉“var item={}”

标签: scrapy

解决方案


您可以尝试这样的操作: //script[contains(., "var item={}")]


推荐阅读