首页 > 解决方案 > 是否可以在 2 个以上的流之间共享 foreachBatch 的 batchId?

问题描述

我面临的问题是我的流程依赖于 batchId 作为对管道第二阶段准备好的某种控制。所以只有第一阶段(批次)完成后才会进入第二阶段。

我想确保在需要时通过将更多流附加到同一数据源来提高速度。<<-- (这就是为什么这不是重复的帖子)

我还想保证万一出现问题,流可以从它停止的地方继续。

标签: pysparkspark-streamingazure-databricks

解决方案


推荐阅读