如何根据值列表过滤 RDD
How to filter a RDD according to list of values
我能够使用特定值完成 RDD[Test] 的过滤器
Test.filter(_.state == "NY")
我需要扩展它以便能够过滤具有多个值的测试,例如 ("NY"、"CA"、"PA")
在 scala
中是否有 "in list" 或 ("NY","CA","PA")
您可以将值放入 Set 中并按以下方式进行过滤:
val set = Set("NY", "CA", "PA")
rdd.filter(item => set(item.state))
测试值是否在集合中:
set.contains(value)
或
set(value)
我能够使用特定值完成 RDD[Test] 的过滤器
Test.filter(_.state == "NY")
我需要扩展它以便能够过滤具有多个值的测试,例如 ("NY"、"CA"、"PA")
在 scala
中是否有 "in list" 或 ("NY","CA","PA")您可以将值放入 Set 中并按以下方式进行过滤:
val set = Set("NY", "CA", "PA")
rdd.filter(item => set(item.state))
测试值是否在集合中:
set.contains(value)
或
set(value)