首页 > 解决方案 > 在 Spark 结构化流中处理来自传入运动流的空批次

问题描述

我们正在从 kinesis 读取数据并使用 spark 结构流将其输出到文件中。当流中没有数据时,kinesis 实现正在生成空批次。这些空批次正在创建空白文件作为输出?知道我们如何阻止火花写出空白文件

标签: apache-sparkpysparkspark-structured-streaming

解决方案


分区输出修复了空集问题


推荐阅读