Kafka 流:流线程与存储

Kafka streams: stream threads vs store

假设我们有一个配置如下的实例,状态在商店中维护。

主题 - 1
分区 - 6
num.stream.threads - 6

拓扑
来源 - 1
低级处理器 - 3(每日、每月和每年各一个处理器 聚合)
下沉 - 3

Kafka Streams 将创建 6 个任务,因为源主题有 6 个分区。状态,将被划分为 6 个分片,每个任务一个分片。因此,任务中的本地存储是任务独占的,只包含相应分片的数据。如果您按任务扫描整个商店,您将不会在输出主题中获得重复数据,因为它在每个分片中都是不同的数据。