airflow - 当我们有更多的 dag 文件时,会跳过气流运行
问题描述
我已经安装了 apache-airflow==1.10.8。我在 AIRFLOW_HOME 文件夹中有大约 200 个 dag 文件。每个 dag 文件可能需要大约 20 秒的执行时间。我已安排每个 dag 文件每 2 分钟运行一次 ' */2 * * * *' 。但是当我看到任何特定 dag 的日志时,我发现 dag 不是每 2 分钟执行一次。附上我从日志目录中获得的特定 dag 的执行时间。
2020-06-02T10:14:00+00:00
2020-06-02T10:24:00+00:00
2020-06-02T10:34:00+00:00
2020-06-02T10:44:00+00:00
2020-06-02T11:14:00+00:00
2020-06-02T11:24:00+00:00
以下是airflow.cfg中的配置
本地执行器,
并行度 = 32
dag_concurrency = 16
max_active_runs_per_dag = 16
dagbag_import_timeout = 30
dag_file_processor_timeout = 50
task_runner = StandardTaskRunner
我怎样才能让气流每 2 分钟执行一次 dag?
其他详细信息:Ubuntu 18.04 和 Python 3.7
解决方案
推荐阅读
- c# - 带有 SignalR 的 Blazor 服务器项目无法在我的 IIS 服务器上运行
- python - 有没有办法从 CSV 文件中查找和设置 DataType,而无需事先指定?
- java - Java中的正则表达式模式用于替换除某些标记序列之外的所有内容
- javascript - mapStateToProps 改变道具
- reactjs - 观察到这个错误:Material-UI:提供给组件的 `anchorEl` 道具无效
- recursion - 生成具有给定位数集和位索引总和的整数列表
- angular - 如何使用 rxjs 重试并在此之后执行函数
- javascript - 使用 blob api 保存对象。如何?
- asp.net - Owin 身份验证:SSO 令牌与 ID 令牌
- mongodb - MongoDb 聚合:当给定数组 1 和数组 2 时,如何根据另一个数组 2 对数组 1 进行分组?