如何根据值列表过滤 RDD

How to filter a RDD according to list of values

我能够使用特定值完成 RDD[Test] 的过滤器

Test.filter(_.state == "NY") 

我需要扩展它以便能够过滤具有多个值的测试,例如 ("NY"、"CA"、"PA")

在 scala

中是否有 "in list" 或 ("NY","CA","PA")

您可以将值放入 Set 中并按以下方式进行过滤:

val set = Set("NY", "CA", "PA")
rdd.filter(item => set(item.state))

测试值是否在集合中:

set.contains(value) 

set(value)