首页 > 解决方案 > Kafka 流:流线程与存储

问题描述

假设我们有一个实例,其配置如下,并且在商店中维护状态。

主题 - 1 个
分区 - 6
num.stream.threads - 6

拓扑
源 - 1 个
低级处理器 - 3(每日、每月和每年聚合各一个处理器)接收
器 - 3

标签: apache-kafkaapache-kafka-streams

解决方案


Kafka Streams 将创建 6 个任务,因为源主题有 6 个分区。状态,将被划分为 6 个分片,每个任务一个分片。因此,任务中的本地存储是任务专有的,仅包含相应分片的数据。如果您按任务扫描整个商店,您将不会在输出主题中获得重复数据,因为每个分片中的数据不同。


推荐阅读