python - Scrapy HTTP 状态:404
问题描述
我正在使用 scrappy 抓取一个 URL,下面是蜘蛛的代码。问题是它显示 404 错误,而在 scrappy shell 上没有 404 错误。
在 settings.py 我添加了用户代理值USER_AGENT = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.131 Safari/537.36"
,并且ROBOTSTXT_OBEY = False
import scrapy
class UsaFloridaScrapperSpider(scrapy.Spider):
name = 'usa_florida_scrapper'
start_urls = ['https://www.txlottery.org/export/sites/lottery/Games/index.html/']
def parse(self, response):
print("HTTP STATUS: "+str(response.status))
解决方案
推荐阅读
- php - 2002:从 PHP My SQL 插入数据时连接超时
- precision - 物体检测中的mAP是什么?
- javascript - JavaScript Proxy Setter 不进行第二次代理调用
- arrays - 来自 MultiArray 的 Laravel 嵌套数组
- python - 如何在数据框中使用按元素分组的索引?
- scala - 如何使用 Spark 和 Scala/PySpark 从 Amazon QLDB 读取数据?
- reactjs - 在一个类组件中使用 React Context API 的多个上下文
- c - 将 funopen 重定向到标准输入/标准输出的便携式方法
- itext - Itext 7.1.6 合并文档时出现内存不足错误
- java - 将两张不同类型的地图合并为一张地图