python - 从 Scrapy 日志中删除忽略响应消息
问题描述
我使用 python scrapy 并且网站有很多不正确的链接,导致 404 状态代码页面。Scrapy在日志中添加消息“忽略响应404” - 它非常填写日志,如何删除那种消息?
解决方案
Scrapy 使用 python 的logging
模块,所以你可以按照通常的方式来做——获取相关的记录器并改变它的记录级别。
该文档甚至在Logging - Advanced custom下显示了这个确切的示例:
import logging
import scrapy
class MySpider(scrapy.Spider):
# ...
def __init__(self, *args, **kwargs):
logger = logging.getLogger('scrapy.spidermiddlewares.httperror')
logger.setLevel(logging.WARNING)
super().__init__(*args, **kwargs)
推荐阅读
- javascript - Javascript 日期 | 将日期设置为一年的最后一秒
- powershell - 获取 3rd 方模块的 cmdlet 参数信息
- vuejs2 - 使用带参数的自定义规则(vue js - vee validate)
- angular - 当我第二次切换到显示状态时,动画状态没有切换
- c# - 避免嵌套 if/else if 以及在条件语句中同时避免 InvalidOperationException
- html - CSS Masonry Layout:瓷砖动态高度的问题
- php - 将值从视图传递和隐藏到控制器 - Codeigniter
- sql - 如何在sql中对多列进行排序
- java - 如何处理面向对象语言中类之间的关系?
- python - 如何在硒中滚动网页时转到网站的下一页并继续滚动等等?