如何打印 purrr::map 在 R 中作用的数据帧行

How to print row of dataframe that purrr::map is acting on in R

我正在使用 purrr::map 到 运行 一个长数据框列表列上的耗时函数,我想打印一个正在执行的行的指示符,以便我可以跟踪进度。

这是一个小例子:

当我运行这个:

library(dplyr)
library(tidyr)
library(purrr)
mtcars %>% 
    group_by(carb) %>% 
    nest() %>% 
    mutate(n = map(data, nrow))

我想输出正在执行的行的 carb

#> 4
#> 1
#> 2
#> 3
#> 6
#> 8

你可以像这样使用 for 循环得到:

df <-
    mtcars %>% 
    group_by(carb) %>% 
    nest() %>% 
    mutate(n = NA)
for (i in 1:nrow(df)) {
    print(df$carb[i])
    df$n[i] <- list(nrow(df$data[[i]]))
}

您可以 运行 到 carb 同时使用 map2() 运行 到 data。然后你可以在你的函数中添加一个 print() 语句来输出 carb.

dat = mtcars %>% 
    group_by(carb) %>% 
    nest() %>% 
    mutate(n = map2(data, carb, ~{
        print(.y)
        nrow(.x)
        }) 
        )

[1] 4
[1] 1
[1] 2
[1] 3
[1] 6
[1] 8

dat
# A tibble: 6 x 3
   carb data               n        
  <dbl> <list>             <list>   
1     4 <tibble [10 x 11]> <int [1]>
2     1 <tibble [7 x 11]>  <int [1]>
3     2 <tibble [10 x 11]> <int [1]>
4     3 <tibble [3 x 11]>  <int [1]>
5     6 <tibble [1 x 11]>  <int [1]>
6     8 <tibble [1 x 11]>  <int [1]>

为了方便起见,我使用了公式语法,其中 .x 指的是 map2() 中的第一个向量,.y 指的是第二个向量。相反,如果更清楚的话,您可以执行匿名函数。 (我不确定我是否喜欢带波浪号的括号。)

mtcars %>% 
    group_by(carb) %>% 
    nest() %>% 
    mutate(n = map2(data, carb, function(x, y) {
        print(y)
        nrow(x)
        })
        )