python - scrapy-crawlera 是否处理 429 状态码?
问题描述
想知道是否有人知道在使用 scrapy 时,scrapy-crawlera 中间件是否处理 429 状态码,或者我是否需要实现自己的重试逻辑?
我似乎在任何地方都找不到它的记录
解决方案
回答你的问题:不,scrapy-crawlera中间件不处理429
状态,它实际上不“处理”任何状态,它只是处理 Crawlera 和 Scrapy 之间的通信。
现在, about Crawlera
,他们429
默认处理状态,这意味着当他们获得429
响应状态时,他们会将其标记为禁止并重试相同的请求。
如果 Crawlera 在多次重试后没有成功,它将503
向客户端返回一个状态(本例中为 Scrapy)。
推荐阅读
- r - 访问通过模块创建的数据框及其名称并将它们存储在列表中
- r - 我在 R 中的 performanceAnalytics 包中的 performanceSummary 图表有问题
- javascript - 如何通过模拟选择器和/或 redux store 来编写 Redux Saga 测试
- docker - 当有多个摘要的标签时,docker pull 如何工作(用于 os/arch)
- java - 从 python 服务器发送到 java 客户端的定时数据
- sql - 列出 SQL Server 中的数据库并跳过 master
- .net - 以编程方式修复“Word 在损坏的...中发现不可读的内容”
- java - 将此字符串转换为字符串数组的最佳方法是什么?
- html - 如何使页脚内容全部位于页脚的中心?
- javascript - 更改 swiper 对象参数