command-line - 如何设置scrapy shell的默认用户代理
问题描述
我在 中设置了默认的用户代理settings.py
,但是-s
每次使用scrapy shell
.
我知道我可以使用类似的命令alias scrapys="scrapy shell -s USER_AGENT='xxxxx'"
来做到这一点,但是有没有更好的方法来实现它?
解决方案
解决方案 1
设置应该足以满足您的需要USER_AGENT
。settings.py
如果您对这种方式有疑问,请提供更多信息(例如使用tree
命令打印您的项目结构。)。
要settings.py
通过scrapy shell ...
命令读取,请确保
您正在项目根目录中运行该命令,您可以在其中看到一个
scrapy.cfg
文件。settings.py
模块路径定义在scrapy.cfg
.[settings] default = project_name.settings
project_name.settings
是 的模块路径settings.py
。
解决方案 2
使用蜘蛛类属性Spider.custom_settings
。
class MySpider(scrapy.Spider):
name = 'myspider'
custom_settings = {
'USER_AGENT': 'some value',
}
这个蜘蛛特定的设置 dict.custom_settings
否决了全局settings.py
.
参考
推荐阅读
- python - b64encode 带参数
- php - 如果产品类别有子项,则从 WooCommerce 中的父项中删除永久链接
- discord.js - Discord bot 如何让机器人删除文本频道?
- google-analytics - 来自多个类似来源的 PowerBI 在没有明显原因的情况下不匹配会话
- pandas - 堆叠、拆垛、融化、旋转、转置?将多列转换为行(PySpark 或 Pandas)的简单方法是什么?)
- mysql - 将 Django 查询集转换为列表时,表情符号的 mySQL unicode 解码错误
- javascript - 以下语法在带有反应钩子的 JavaScript 中是什么意思
- reactjs - 调用 firebase 函数的问题
- python - AttributeError:“列表”对象没有属性“时间”
- javascript - 如何编写可以生成用户指定数量的 css 方块的脚本