xpath - Scrapy:将 HTML 提取为元素内的字符串
问题描述
我想在dic
. 例如在这段 HTML 中:
<div id="main"><h1><xyz>Title<xyz></h1></div>
我想提取 div 内容:<h1><xyz>Title<xyz></h1>
作为字符串。使用 CSS o Xpath scrapy 选择器可以做到这一点吗?
谢谢 :)
解决方案
对于 XPath,使用专用函数 string() :
string(//div[@id='main']/h1/xyz)
输出:“标题”
编辑:如果您正在寻找“标题”,则输出整个路径:
concat(concat("<",name(//*[.="Title"]/parent::*),">"),concat("<",name(//*[.="Title"]),">"),string(//*[.="Title"]),concat("</",name(//*[.="Title"]),">"),concat("</",name(//*[.="Title"]/parent::*),">"))
输出 :<H1><XYZ>Title</XYZ></H1>
推荐阅读
- c# - 将表达式传递给初始化程序
- mono - VS 2017 on Windows 10 Downgrading to Mono 5.16
- zapier - 需要在 Zapier 中使用 javascript 代码步骤删除数字
- python - 如何修复'名称“xxx”未定义
- python - 如何设置 SQLAlchemy 关系,以便两个表彼此具有多个关系?
- python-3.x - Bitwise_and 函数返回错误断言失败且掩码相同
- php - PHP魔术常量 - 自动传递给函数?
- javascript - Stripe:如何在给定信用卡信息的情况下创建客户对象
- node.js - 如何解决 AWS Lambda 中的 Runtime.HandlerNotFound 错误
- laravel - 在 Laravel 中为关系分配 id