web-scraping - Scrapy xpath 语法
问题描述
如何使用 xpath 获取嵌套在以下 div 中的段落文本,但在参考之前停止?谢谢!
我为第一段尝试了 SELECTOR = '//div/text() = "entry-content"/p[1]/text() ,但它没有用。
<div class="entry-content"> == 0
<div id="dpsp-content-top">...</div>
<span id="xxx">...</span>
<h5>...</h5>
<p>...</p>
<p>...</p>
<p>...</p>
<h5>Reference</h5>
<p>...</p>
<p>...</p>
</div>
解决方案
这应该返回“参考”之前的所有“P”元素
//div[@class='entry-content']//h5/strong[contains(text(),'Reference')]/preceding-sibling::p
如果您需要来自“p”元素的文本,试试这个,
//div[@class='entry-content']//h5/strong[contains(text(),'Reference')]/preceding-sibling::p/text()
推荐阅读
- javascript - React Native 如何读取实时数据库 Firebase
- menu - 在 Hugo 中订购菜单项
- ios - Flutter IOS 构建应用程序用于在特定设备上进行测试 XCode 9.2
- c++ - 如何通过函数指针递归调用类成员函数?
- marklogic - MarkLogic 9 - 运行 corb 时合并
- c++ - 类和向量
- bash - 如何从输出的第二行开始插入 0(零)
- javascript - 记住视频播放最后位置 Jquery ajax PHP
- velo - 蜡 | 为什么不能将自动加载输入文本值存储到数据库中
- gnuplot - Gnuplot:从 csv 文件中获取子字符串