测试 R 中两个相同结构列表的每个元素的相等性：如何更快

Question

我的目标是获得一个与两个初始列表具有相同结构的列表，不同之处在于每个元素必须是一个逻辑向量。

考虑两个列表：

mlist <- rep(list(rep(c(0,2,4),68),c(1),
              sample(x = c("a","b"),size = 1, prob = c(.5,.5))),200)
klist <- rep(list(rep(c(0,2,3),68), c(0),
              sample(x = c("a","b"),size = 1, prob = c(.5,.5))),200)

请注意，在给定的列表中，每个元素都是一个向量，可以是字符串也可以是数字，并且它们的长度不一定相同。但是，这两个列表具有完全相同的结构。

我要查找的列表具有相同的结构，并且表明两个列表的每个向量中的每个元素都相等。 For 循环提供了一个令人不快的解决方案：

hon <- as.list(rep(NA ,length(mlist)))
for(i in seq(length(mlist))){
  for (m in seq(length(mlist[[i]]))){
    hon[[i]][[m]] <- mlist[[i]][[m]]==klist[[i]][[m]]
  }
}

另一种解决方案，使用 purrr 包，稍微优雅一些，但速度较慢，是

han <- map2(klist,  mlist, map2_lgl, identical)

for 循环方法的耗时为 0.054，purr 方法的耗时为 0.129。有没有更有效的替代方案？

Answer 1

你总是将向量作为列表的元素吗？

如果是这样，您可以使用矢量化 ==。就这样

hin <- lapply(seq_along(mlist), function(i) {
  mlist[[i]] == klist[[i]]
})

all.equal(hin, hon)
[1] TRUE

Answer 2

你可以考虑

unlist(klist) == unlist(mlist)

但这会丢弃列表格式。

您可以通过比较

来确定每个结果的原始索引

cumsum(lengths(mlist))

测试 R 中两个相同结构列表的每个元素的相等性：如何更快

Testing equality for each element of two identically structured lists in R: how to be faster

performance

r

list

purrr