首页 > 解决方案 > Xpath + Scrapy + Python:无法抓取数据点

问题描述

这是 XML 结构:

<tr>
   <td>
       <font size="3">
           <strong>Location:</strong> 
           Hiranandani Gardens, Powai
       </font>
   </td> 
</tr>  

我要提取 : Hiranandani Gardens, Powai

我试过这些:

response.xpath('//font[@size="3"]/strong[text()="Location:"]/text()').extract()

response.xpath('//font[@size="3"]/strong[text()="Location:"]').extract()

两者都返回了一个空列表。

注意:我们必须使用标签的文本,即“位置:”。否则,站点上还有许多其他地方使用相同的 XML 结构。因此,如果不使用强标签的文本,它将获取除所需值之外的更多不必要的东西。

标签: pythonxpathscrapy

解决方案


尝试以下 XPath 以获得所需的输出

//font[@size="3" and normalize-space(strong)="Location:"]/text()

推荐阅读