Scala - 按公共元素合并两个元组列表
Scala - Merge two lists of tuples by common elements
如何合并两个模拟 Chasles 关系的元组列表?
(a, b), (b, c) => (a, c)
这是一个例子:
val l1 = List(("Dan", "b"), ("Dan","a"), ("Bart", "c"))
val l2 = List(("a", "1"), ("c", "1"), ("b", "3"), ("a", "2"))
预期结果为:
val result = List(("Dan", "3"), ("Dan", "1"), ("Dan", "2"), ("Bart", "1"))
您基本上想要考虑第一个列表中的一个元素和第二个列表中的一个元素的所有对,并保留 "b" 元素匹配的那些。
换句话说,我们要映射到 l1
并在该映射内映射到 l2
,这意味着我们考虑每个列表中的所有元素对,例如:
l1.map(x => l2.map(y => (x,y))
不过这不太正确,因为我们现在有一个 List[List[((String, String),(String,String))]]
-- 我们需要平面图:
l1.flatMap(x => l2.map(y => (x,y)))
现在我们必须过滤以仅保留我们想要的对并进行整理:
l1.flatMap(x => l2.map(y => (x,y)))
.filter{ case ((_,y),(b,_)) => y == b }
.map {case ((x, _),(_,c)) => (x,c) }
这给了我们
List((Dan,3), (Dan,1), (Dan,2), (Bart,1))
那是一团糟,所以我们可以稍微整理一下——让我们在原始 flatmap
中过滤 l2
并在那里构建结果,这样我们就不会必须兼顾元组的元组:
l1.map{ case (x,y) =>
l2.filter{ case (b, _) => y == b}
.map{ case (_, c) => (x, c)} }
这是其中一种更容易阅读 for
理解的情况:
for {
(x, y) <- l1
(b, c) <- l2
if y == b
} yield (x,c)
对于 l1
中的每个元组,您可以过滤 l2
到 select 具有匹配第一个元素的元组:
def join[A, B, C](l1: List[(A, B)], l2: List[(B, C)]): List[(A, C)] = {
for {
(key, subkey) <- l1
value <- l2.collect { case (`subkey`, value) => value }
} yield key -> value
}
您也可以事先将 l2
转换为 Map
以获得更好的 selection 性能:
def join[A, B, C](l1: List[(A, B)], l2: List[(B, C)]): List[(A, C)] = {
val valuesMap = l2.groupBy(_._1)
for {
(key, subkey) <- l1
(_, value) <- valuesMap.getOrElse(subkey, Nil)
} yield key -> value
}
如何合并两个模拟 Chasles 关系的元组列表?
(a, b), (b, c) => (a, c)
这是一个例子:
val l1 = List(("Dan", "b"), ("Dan","a"), ("Bart", "c"))
val l2 = List(("a", "1"), ("c", "1"), ("b", "3"), ("a", "2"))
预期结果为:
val result = List(("Dan", "3"), ("Dan", "1"), ("Dan", "2"), ("Bart", "1"))
您基本上想要考虑第一个列表中的一个元素和第二个列表中的一个元素的所有对,并保留 "b" 元素匹配的那些。
换句话说,我们要映射到 l1
并在该映射内映射到 l2
,这意味着我们考虑每个列表中的所有元素对,例如:
l1.map(x => l2.map(y => (x,y))
不过这不太正确,因为我们现在有一个 List[List[((String, String),(String,String))]]
-- 我们需要平面图:
l1.flatMap(x => l2.map(y => (x,y)))
现在我们必须过滤以仅保留我们想要的对并进行整理:
l1.flatMap(x => l2.map(y => (x,y)))
.filter{ case ((_,y),(b,_)) => y == b }
.map {case ((x, _),(_,c)) => (x,c) }
这给了我们
List((Dan,3), (Dan,1), (Dan,2), (Bart,1))
那是一团糟,所以我们可以稍微整理一下——让我们在原始 flatmap
中过滤 l2
并在那里构建结果,这样我们就不会必须兼顾元组的元组:
l1.map{ case (x,y) =>
l2.filter{ case (b, _) => y == b}
.map{ case (_, c) => (x, c)} }
这是其中一种更容易阅读 for
理解的情况:
for {
(x, y) <- l1
(b, c) <- l2
if y == b
} yield (x,c)
对于 l1
中的每个元组,您可以过滤 l2
到 select 具有匹配第一个元素的元组:
def join[A, B, C](l1: List[(A, B)], l2: List[(B, C)]): List[(A, C)] = {
for {
(key, subkey) <- l1
value <- l2.collect { case (`subkey`, value) => value }
} yield key -> value
}
您也可以事先将 l2
转换为 Map
以获得更好的 selection 性能:
def join[A, B, C](l1: List[(A, B)], l2: List[(B, C)]): List[(A, C)] = {
val valuesMap = l2.groupBy(_._1)
for {
(key, subkey) <- l1
(_, value) <- valuesMap.getOrElse(subkey, Nil)
} yield key -> value
}