首页 > 解决方案 > FlinkKafkaConsumer 水印图图例

问题描述

我试图图片https://ci.apache.org/projects/flink/flink-docs-stable/dev/event_timestamps_watermarks.html#watermark-strategies-and-the-kafka-connector理解这张图片

标签: apache-flink

解决方案


以下是我对这张图的解释:

  • 带有类似文本的白色矩形N|39表示带有时间戳 39 的键 N 的事件
  • 带有数字的黄色矩形显示该运算符实例的当前水印
  • W(33)是线路上的水印,时间戳为 33
  • 附近的黑色虚线W(17)表示它W(17)是流数据流的一部分
  • 灰色圆圈中的数字,即 Source、map 或 window 下的 (1) 或 (2) 表示并行实例

此外,四个橙色圆柱体是 Kafka 分区。Source(1)并且Source(2)每个都连接到两个 Kafka 分区。FlinkKafkaConsumer正在跟踪迄今为止在每个分区中观察到的最大时间戳,并且正在相对于每个分区最大值中的最小值发出水印(在减去一些有界延迟之后,在 BoundedOutOfOrderness 水印策略的情况下)。


推荐阅读