airflow - 气流调度程序没有立即调度简单的 DAG 任务
问题描述
我已经安排了一个带有简单 bash 任务的 DAG,每 5 分钟运行一次:
# bash_dag.py
from airflow import DAG
from airflow.operators.bash_operator import BashOperator
from datetime import datetime, timedelta
default_args = {
'owner': 'airflow',
'start_date' : datetime(2019, 5, 30)
}
dag = DAG(
'bash_count',
default_args=default_args,
schedule_interval='*/5 * * * *',
catchup = False
)
t1 = BashOperator(
task_id='print_date',
bash_command='date',
dag=dag
)
调度工作正常,DAG 每 5 分钟阈值执行一次。但是,我注意到第 5 分钟阈值和任务排队时间之间存在显着延迟。对于图像中显示的示例,任务排队需要 3 到 50 秒。例如,映像中的最后一次 DAG 执行本应在 20:05:00 之后触发,但任务实例在 28 秒后(20:05:28)排队。
我很惊讶会出现这种情况,因为正在安排的 DAG 有一个非常简单的任务。这是正常的气流延迟吗?在处理更复杂的 DAG 时,我是否应该期待进一步的延迟?
我在带有 OS Mojave 的 16 GB Mac 上运行本地气流服务器,Postgres 作为数据库。机器不受资源限制。
解决方案
推荐阅读
- tabulator - 未应用添加新行的制表符自定义排序定义
- excel - 在 VBA 中以定义的名称存储锯齿状数组
- python - 从 Python 中读取列表
- bash - 为什么 userdata 在我的 Terraform 代码中不起作用?
- socket.io - 未捕获的类型错误:无法读取未定义 socket.io.client 的属性“sid”
- database - 随着文档大小的增加,文档需要在 mongo 4.4 中重新定位的频率
- jquery - jQUery 5000+ 行 .append() 改进?
- javascript - 带有值的 Javascript 数组
- java - 编译时间与运行时间(通过查看代码)
- azure - ARM模板:如何以数组格式读取输出结果