如何为具有多个分区的 Kafka 主题启动多个消费者?

How can I start multiple consumers for a Kafka topic with multiple partitions?

我最近开始使用 spark 并且必须处理一个情况,我需要在 spark 中使用 Kafka 主题的多个分区。如何启动多个消费者?我是否需要使用相同组 ID 的相同应用程序 运行 的多个实例?还是在启动应用程序时我可以使用任何配置并在内部完成该工作?

通过 --num-executors 并且每个执行器使用一个以上的核心将在 Spark 中产生多个消费者线程

每个消费者线程都映射到一个分区。

使线程总数等于分区总数以最大化分布式吞吐量