python - Scrapy无法通过xpath找到数据
问题描述
页面:https ://forum.lowyat.net/PropertyForSale
我正在尝试使用旧版本的 IPB(免费时)从论坛中抓取一些项目。
使用 Xpath Helper(Chrome 扩展),我确定了主题标题的 xpath。例如,这个:
response.xpath("//div[@id='forum_topic_list']/table/tbody/tr[7]/td[@class='row1'][4]/div/div[1]/a[1]").extract()
应该返回:
WTS 2 storey terrace house
但它不返回任何东西。
只有在使用以下内容扩大范围后,我才收到回复:
response.xpath("//div[@id='forum_topic_list']/table").extract()
这似乎返回了页面的 html。
我还尝试使用 CSS 选择器,它产生了更好的结果,使用以下内容:
response.css('tr td.row1 div div a::text').extract()
问题是它不只返回主题标题。
我究竟做错了什么?
编辑:只是想澄清页面没有使用javascript显示数据,因为我尝试禁用它加载得很好的javascript。
解决方案
推荐阅读
- postgresql - 在插入分区表 postgres 期间锁定
- java - 在 RCP 中打开视图时如何刷新视图?
- ios - 如何在 UiTableView 中的 Xcode 上显示 Firebase 实时数据库的时间戳
- xcode - Xcode|LLDB:线程跳转 -b 1 在闭包内
- jsonschema - json-schema - 允许在所需属性中进行逻辑或
- javascript - mongodb - 展开嵌套子文档
- javascript - javascript: 'return' 被忽略并不断循环
- swift - 如何快速将几张图像作为一张图像保存到照片库?
- windows - DOS命令从文件名中删除空格
- python - Django 项目的 Cron 作业未激活