airflow-scheduler - 气流 | 多天批量调度 URL
问题描述
我需要一些有关使用 Airflow 设置刮板的建议。
问题是可以说我有一个网站要抓取,它有一些 3k 链接。我想把它分成 3 批,每批 1k,所有这些都必须在不同的日子里运行。
在这种情况下,最好的方法是什么?如果我们可以做一些条件参数基础调度。示例 我有 excel 作为我的数据源,所以在每个 url 旁边我可以提到批次号……如果我们可以以不同的方式安排,现在基于批次号?
希望这有点道理。请建议
解决方案
推荐阅读
- r - 将三张图合二为一
- python - 打印数据帧的函数,它使用 df 名称作为参数
- javascript - 如何过滤掉数组中不包含特定值的单词?
- python - 如何从图像文件夹创建数据集以在 Python 中进行文本识别
- java - 如何在一个 Spring Boot 应用程序中使用多个 mongodb 数据库并在单个 yml 文件中进行配置
- javascript - 在函数参数中设置空数组
- python - 使用 2 个重叠列表恢复 MinMax 缩放
- python - 为什么 Azure 内容审查器无法检测到自定义术语?
- python - 如何在基于函数的视图中查询模型管理器以获取 single_page(detail.html)
- android - 布局在圆形下巴上被裁剪