python - Scrapy 没有使用 extract_first() 获得干净的文本
问题描述
我正在尝试从许多跨度标签下的网站上抓取一些文本,但没有得到干净的文本,任何帮助将不胜感激!
这是网址:
https://www.example.com
这就是我正在尝试的
response.xpath('//div[@class="agency-header__address"]').extract_first()
预期输出:
Level 18, 25 Bligh Street, SYDNEY, NSW 2000
解决方案
您可以通过提取以下字符串表示来获取所需的文本div
:
response.xpath('string(//div[@class="agency-header__address"])').extract_first()
推荐阅读
- python - TkInter 的 Python 错误和异常
- html - 根据 if 条件隐藏 HTML 按钮
- jquery - 使用所选选项填充文本区域
- sql-server - SQLServer 差异备份和还原
- javascript - Axios 捕获错误返回 JavaScript 错误而不是服务器响应
- json - JSOn 解析问题 - 在数组中
- jquery - Chartjs 条形图多个工具提示出现在单个图表上
- c# - 使用 FromQuery 时是否可以将类对象默认为 null
- c++ - 关闭 AF_PACKET 与 AF_INET 的时间差?
- latex - 更改大学名称,论文标题 ea 用于不同语言的摘要