首页 > 解决方案 > Scrapy 没有使用 extract_first() 获得干净的文本

问题描述

我正在尝试从许多跨度标签下的网站上抓取一些文本,但没有得到干净的文本,任何帮助将不胜感激!

这是网址:

https://www.example.com

这就是我正在尝试的

response.xpath('//div[@class="agency-header__address"]').extract_first()

预期输出:

Level 18, 25 Bligh Street, SYDNEY, NSW 2000

标签: pythonxpathscrapy

解决方案


您可以通过提取以下字符串表示来获取所需的文本div

response.xpath('string(//div[@class="agency-header__address"])').extract_first()

推荐阅读