Flink non-keyed window 并行度大于 1
Flink non-keyed window with parallelism greater than 1
我正在使用 FlinkKafkaConsumer(...) 使用超过 50 个分区的 Kafka 主题。我想为这些分区创建 windows。但是,我不希望有任何改组,所以我不能使用 DataStream.keyBy(...)。如果我调用 DataStream.windowAll(...),并行度将为 1,这也不是我所期望的。
那么有什么方法可以同时保持高并行度和无数据混洗?
谢谢
如果不使用 keyBy,您的选择将变得相当有限。您可以使用(非键控)ProcessFunction
实现某种并行窗口,但您无法访问计时器或键控状态,只能访问 operator state.
我正在使用 FlinkKafkaConsumer(...) 使用超过 50 个分区的 Kafka 主题。我想为这些分区创建 windows。但是,我不希望有任何改组,所以我不能使用 DataStream.keyBy(...)。如果我调用 DataStream.windowAll(...),并行度将为 1,这也不是我所期望的。
那么有什么方法可以同时保持高并行度和无数据混洗?
谢谢
如果不使用 keyBy,您的选择将变得相当有限。您可以使用(非键控)ProcessFunction
实现某种并行窗口,但您无法访问计时器或键控状态,只能访问 operator state.