airflow - 在 Airflow 中每小时运行 dag
问题描述
我的达格
{
'owner': 'airflow',
'start_date': datetime(2020, 1, 10, 7, 1, 00),
'depends_on_past': False,
'catchup_by_default': False,
}
dag = DAG('Hourly_test_2', schedule_interval='0 * * * *', default_args=default_args)
它每小时运行一次,但在树视图图中显示的时间减少了 1 小时。树视图图中的示例时间显示上午 8 点,但实际时间是上午 9 点。如何同步两次?
作业应该每小时运行一次,并且每小时应该与树视图中的当前小时相匹配。
解决方案
这不是时间同步问题,这是由于 start_date 和 schedule_interval,airflow 默认计算从 start_date 到当前日期应该执行多少次,并针对任何尚未执行的时间间隔启动 DAG Run 检查here .
在您的情况下,开始日期是 7:01,根据您的 schedule_interval 执行间隔是 8:00、9:00、10:00 ...
这就是为什么在 8:00 有 DAG 运行的原因,您可以通过在 dag 定义中设置参数 catchup = False 默认禁用此行为。
dag = DAG('Hourly_test_2', catchup=False, schedule_interval='0 * * * *', default_args=default_args)
推荐阅读
- android - 动态创建的 EditText 出现在模拟器中,但未出现在设备上
- function - 如何在 SSRS 中使用 LookUpSet 对 Join 函数中的值进行排序?
- python - 使用 boto3 假设角色与网络身份
- php - 将自定义 Woocommerce 短代码转换为 archive-product.php 的 php 代码
- applescript - AppleScript:如何从字符串中提取数字?
- cygwin - 在 cygwin 环境中安装 CDO
- c++ - C++ 错误控制台与桌面应用程序视觉工作室
- css - 使用可扩展和不可扩展单元之间的故障
- doctrine - addSelect() 学说存储库有问题。多对多关系
- python - 无法在 python 中制作一个 10x10 的矩阵