python-3.x - Python Scrapy - 尝试使用“#”分页并将我重定向到同一页面
问题描述
我正在为这个页面构建一个刮板, 我想在第一页工作后进入下一页,在将自动油门和下载速度设置为温和之后,我尝试使用:
next_page = response.xpath('//div[@class="global-pagination"]/a[@class="next"]/@href').get()
if next_page is not None:
yield response.follow(next_page, self.parse)
问题是该类中的 href 是 # 并且基本上它会再次打开相同的页面。我如何使它工作?
解决方案
如果您查看您的浏览器开发工具,您会看到当您转到其他页面时会从loadresult加载数据。此外,通过在表单数据中搜索,您会看到一个名为page
具有您请求的页面的值的字段,您可以通过在您的表单数据中更改它来请求任何其他页面FormRequest
。
from scrapy.http import FormRequest
FormRequst(url=url, formdata=formdata={'page': <page number>}, callback=<parse method>)
推荐阅读
- angular - 如何在ionViewDidEnter中调用Router的重载参数
- r - Leaflet R中的不同颜色(每组)addPolylines
- java - 使用 Java 从 MySQL 中检索图片
- power-automate - Power Automate 无法连接到本地数据网关
- c# - 使用 Aforge 对屏幕截图进行操作
- javascript - 如何从 Meteor FS 集合中检索 Jade 中的图像
- javascript - 显示列表中的 1 个特定图像?
- javascript - 在 Vuex 的一个动作中管理两个状态
- python - 是否可以在 Python 2.7 中使用 tkinter(小写)?
- boost-log - boost log:使用formatting_ostream存储日志