将模拟输出与 R 中的嵌套列表相结合

combining output of simulations with nested list in R

我在 R 中使用 purrr 来模拟数据(使用 B 迭代)和 运行 模型以评估三种方法的性能。我想将结果收集到一个包含三个小标题(每个小标题有 B 行)的列表中,以便对这些小标题执行方法分析。我如何使用 R (purrr) 中的函数式编程原则来实现这一点。这是一个例子:

使用这个创建长度为 r 的列表的函数,每个 r 元素由 n 组成,从标准法线绘制:

list_norms <- function(n, r, seed) {
  set.seed(seed)
  map(1:r, rnorm, n = n) %>%
    set_names(c("A", "B", "C"))
}

那我用map模拟10次:

map(1:10, list_norms, n = 5, r = 3)

这里的结果是一个长度为 10 的列表,其中每个元素都是一个长度为 3 的列表(名为 A、B 和 C),其中每个元素都是一个从正态分布中抽取的 5 向量。我想以一个长度为 3 的列表结束,A、B 和 C 中的每一个都有一个列表,每个列表包含一个包含 10 行(每次模拟迭代一列)和 5 列(每次从正常抽取一个)的小标题).

有没有办法通过 R 中的函数式编程原则,使用 purrr 或 tidyverse 中的其他库来实现这一点?我正在查看 map 和 reduce 的一些组合。

我们可以 transpose list 然后从每个 list 元素创建一个 data.frame

library(dplyr)
library(purrr)
map(1:10, list_norms, n = 5, r = 3) %>% 
      transpose %>%
      map(~ as.data.frame.list(.x) %>% 
            t %>%
              `row.names<-`(., NULL))
#$A
#            [,1]       [,2]       [,3]       [,4]       [,5]
# [1,] 0.37354619  1.1836433  0.1643714  2.5952808 1.32950777
# [2,] 0.10308545  1.1848492  2.5878453 -0.1303757 0.91974824
# [3,] 0.03806658  0.7074743  1.2587882 -0.1521319 1.19578283
# [4,] 1.21675486  0.4575074  1.8911446  1.5959806 2.63561800
# [5,] 0.15914452  2.3843593 -0.2554919  1.0701428 2.71144087
# [6,] 1.26960598  0.3700146  1.8686598  2.7271955 1.02418764
# [7,] 3.28724716 -0.1967717  0.3057075  0.5877070 0.02932666
# [8,] 0.91541393  1.8404001  0.5365172  0.4491650 1.73604043
# [9,] 0.23320396  0.1835417  0.8584648  0.7223950 1.43630690
#[10,] 1.01874617  0.8157475 -0.3713305  0.4008323 1.29454513

#$B
#           [,1]      [,2]      [,3]       [,4]      [,5]
# [1,] 1.1795316 2.4874291 2.7383247  2.5757814 1.6946116
# [2,] 2.1324203 2.7079547 1.7603020  3.9844739 1.8612130
# [3,] 2.0301239 2.0854177 3.1166102  0.7811426 3.2673687
# [4,] 2.6892754 0.7187534 1.7868555  3.8965399 3.7768632
# [5,] 1.3970920 1.5278336 1.3646287  1.7142264 2.1381082
# [6,] 2.3680252 0.6907957 2.7386219  2.0448730 0.9516028
# [7,] 1.0527201 2.7481393 1.8830448  2.1526576 4.1899781
# [8,] 1.8921186 1.8297109 0.9116683 -1.0110517 1.4068257
# [9,] 0.8131275 3.1919869 1.9818097  1.7519154 1.6370631
#[10,] 2.3897943 0.7919238 1.6363240  0.3733273 1.7435216
#...

如果我们也将函数中的 make small change 更改为 return a tibble,我们也可以有一个 tibble 来存储输出

list_norms <- function(n, r, seed) {
  set.seed(seed)
   map(1:r, rnorm, n = n) %>%
  set_names(c("A", "B", "C")) %>%
  as_tibble
   }

map_dfr(1:10, list_norms, n = 5, r = 3, .id = 'grp')