python-3.x - 在scrapy的启动请求中调用http://url
问题描述
我正在使用scrapy从网站上抓取数据
def start_requests(self):
request = scrapy.Request(url="http://www.xxxxx.com",callback=self.parse ,dont_filter = True,)
yield request
从 start_requests 请求 url 时出现错误
raise SchemeNotSupported("Unsupported scheme: %r" % (uri.scheme,))
twisted.web.error.SchemeNotSupported: Unsupported scheme: b''
2018-06-11 13:02:26 [scrapy.core.engine] INFO: Closing spider (finished)
2018-06-11 13:02:26 [scrapy.statscollectors] INFO: Dumping Scrapy stats:
但是当使用安全线路即(“ https://www.xxxxx.com ”)调用相同的请求时,它正在工作,任何人都可以帮忙
解决方案
我有同样的问题,对我来说问题是协议。
我要求使用http
while 那应该是https
当我改变它时,它开始起作用了。
推荐阅读
- python - 添加或删除新值时在 Python 中重新排列列表
- javascript - mqtt.Client(streamBuilder, options) 在 nodejs 中使用 mqtt 的示例
- python - 仅将数据帧的一个子集附加到另一个数据帧
- rust - Rust async-std 奇怪的语法为了解决读写借用的冲突
- java - 将值设置为 Java 15 记录中的属性之一
- pandas - 数据框中下 x 行的频率
- http - HTTP/3 如何处理丢包?
- javascript - 为什么离线二维码脚本不适用于表情符号?
- c# - 如何从 IReadOnlyList 中查找项目
? - sql - Oracle SQL PIVOT“列定义不明确”