RDD 和 SPARK 流式微批处理

RDDs and SPARK Streaming Microbatches

我们可以期望每个微批次始终有 1 个 RDD 吗?或者这取决于接收者的数量?如何保证排序?

  • 单个微批始终是一个 RDD。它不依赖于接收者的数量。
  • 要确保特定的批量订购,您可以使用 stream.transform(_.someMethodThatSortsRDD)