python - 如何使用 Spidermon 进行 Scrapy 历史输出比较
问题描述
所以 Scrapinghub 发布了 Scrapy 质量保险的新功能。它说它具有历史比较功能,可以检测当前的刮擦量是否仅低于前一次刮擦的 50%,这是可疑的。但是,我该如何应用它呢?
解决方案
Spidermon 1.10 版引入了一个新的统计信息收集器,它可以在您的.scrapy
目录中保存您上次作业执行的统计信息 ( https://spidermon.readthedocs.io/en/latest/stats-collection.html )。因此,每次执行蜘蛛时,您stats_history
的 Spider 实例中都会有一个可用的属性,其中包含之前执行的作业的所有先前统计信息的列表。您不再需要像 Luiz 在他的回答中建议的那样手动处理统计数据的存储(但原理基本相同)。
有了这些信息,您可以创建自己的监视器来处理这些统计数据并计算抓取项目的平均值,并将它们与您最近的执行进行比较(或者您可以根据需要使用统计数据)。您可以在前面提到的文档中看到类似的监视器示例。
推荐阅读
- python -
使用 python 的 re.sub() 在指定标签之间替换 \n - c - dev_net_set 在 Linux 中的作用是什么?
- android - react-native run-android 在删除 Gradle 目录时冻结
- java - 如何在谷歌服务插件更新后删除警告“警告:API 'variant.getMergeResources()' 已过时”?
- python - 如何修复“”TypeError:img应该是PIL Image。得到
我是初学者,我正在学习编写图像分类器。我的目标是创建一个
predict
函数。有什么建议可以解决吗?
在这个项目中,我想使用预测功能来识别不同的花种。所以我可以稍后检查他们的标签。
尝试修复:我已经使用了该
unsqueeze_(0)
方法并从 nu- ssl - ISPConfig LetsEncrypt 和自签名证书 BROKEN CONFIG
- azure-devops - 如何处理 Azure Pipeline 中自定义条件的 Null?
- c# - 如何在不搜索相同字符串的情况下比较两个列表?
- javascript - 如何在 Chart.JS 中从 JSON 和 MySQL 绘制带有时间 x 轴的图表?
- r - 返回带有公式 (~) 波浪号和符号的命名列表的函数