airflow - Apache 气流,TimeDeltaSensor 延迟 DAG 中的所有任务
问题描述
如上图所示,我指定了一个气流 dag。git_pull_datagenerator_batch_2
应该由 TimeDeltaSensor延迟wait_an_hour
。
但是,该任务git_pull_datagenerator
似乎也被延迟了,尽管它不依赖于wait_an_hour
. (整个dag安排在2019-12-10T20:00:00,但是git_pull_datagenerator比那晚了一个小时开始)
我检查了所有气流文件,但找不到任何线索。
解决方案
我假设您的日程安排间隔是每小时一次?执行日期为2019-12-10T20:00:00
按@hourly
计划时间间隔运行的 DAG 预计将在第2019-12-10T21:00:00
20 小时“完成”时或之后不久运行。我认为这与传感器无关。
这是一个常见的气流陷阱:
Airflow 是作为 ETL 需求的解决方案而开发的。在 ETL 世界中,您通常会汇总数据。因此,如果我想汇总 2016 年 2 月 19 日的数据,我会在格林威治标准时间 2016 年 2 月 20 日午夜进行,这将是在 2016 年 2 月 19 日的所有数据可用之后。
如果这是正在发生的事情,wait_an_hour
请从2019-12-10T21:00:00
和git_pull_datagenerator_batch_2
开始2019-12-10T22:00:00
。
推荐阅读
- dolphindb - dolphindb配置文件中workerNum和localExcutors有什么区别?
- javascript - 如何在 React with Apollo 中执行 GraphQL Query onClick?
- ruby - 为每个单词创建具有多个定义的字典,并为单词和定义提供 CRUD 功能
- php - 如何过滤 first_name 然后在 PHP PDO 中搜索唯一的 first_name?
- java - 如何知道输入的edittext文本是否是链接?
- r - 在 R 中建模嘈杂的 1/x 数据,从摘要中获得“基本上完美的拟合” - 为什么?
- function - D3 过渡/持续时间在函数内部不起作用
- apache - apache如何访问/root目录下的文件
- postman-pre-request-script - 如何在 Marvel API 的 Postman Pre-Request Script 中设置哈希
- android - 如何修复插件 GsonFormat 不起作用?