首页 > 解决方案 > 重用 Apache Beam 工作流图

问题描述

我正在使用 Apache Beam 在 Flink 上运行 Batch 管道,在 AWS EMR 上运行。

Beam Pipelines 正在创建并提交到一个长期运行的 Flink 集群。但是,我发现构建作业图并将其提交给 EMR 需要花费 2 分钟以上的时间。

我想减少这段时间,想知道是否有办法缓存/防止 Beam 在每次运行 Driver cronjob 时构建管道。

作业图有点复杂,所以 2 分钟的时间是合理的。只是在寻找减少/消除它每次发生的方法。

标签: apache-flinkapache-beamamazon-emr

解决方案


推荐阅读