首页 > 解决方案 > Kafka 分区如何在 Spark 流中与 Kafka 共享?

问题描述

我想知道如何在执行程序进程内部运行的 SimpleConsumer 之间共享 Kafka 分区。我知道高级 Kafka 消费者如何在消费者组中的不同消费者之间共享分区。但是当 Spark 使用 Simple consumer 时会发生这种情况吗?跨机器的流式作业将有多个执行器。

标签: apache-sparkapache-kafkaspark-streaming

解决方案


所有 Spark 执行器也应该属于同一个使用者组。Spark 为 Kafka 消费者使用大致相同的 Java API,只是将其分配到多台机器的调度


推荐阅读