Java 返回多个 RDD 的 Spark map 步骤

Java Spark map step returning multiple RDDs

我有一个映射步骤来计算我需要的 RDD。在计算该 RDD 的数据时,可以计算另一个我感兴趣的指标。有没有办法一步完成,或者我是否必须制作一个单独的地图,其功能与第一个地图几乎相同?

谢谢!

是的,你可以,但是保持每个 "map step" 简单将导致代码更具可读性。

请记住,您的 map() 在调用终止函数之前不会执行,因此从性能的角度来看,无论您是一次 map() 还是两次执行此操作都无关紧要连续 map().map() 次通话

...假设您不必考虑数据改组的影响