迭代 purrr 中的公式
iterating over formulas in purrr
我有一堆公式,作为字符串,我想在 glm 中一次使用一个,最好使用 tidyverse 函数。这是我现在的位置。
library(tidyverse)
library(broom)
mtcars %>% dplyr::select(mpg:qsec) %>% colnames -> targcols
paste('vs ~ ', targcols) -> formulas
formulas
#> 'vs ~ mpg' 'vs ~ cyl' 'vs ~ disp' 'vs ~ hp' 'vs ~ drat' 'vs ~ wt' 'vs ~ qsec'
我可以 运行 使用这些公式中的任何一个作为一般线性模型
glm(as.formula(formulas[1]), family = 'binomial', data = mtcars) %>% glance
#> null.deviance, df.null, logLik, AIC, BIC, deviance, df.residual
#> 43.86011, 31, -12.76667, 29.53334, 32.46481, 25.53334, 30
我想 运行 列表中每个可能的公式的 glm。我试过这样做。
data.frame(formulas = formulas) %>%
mutate(mod = map(formulas, function(fs){
glm(as.formula(fs), family = 'binomial', data = mtcars)
}))
但随后我收到以下错误消息:
Error in mutate_impl(.data, dots): Evaluation error: invalid formula. Traceback:
1. data.frame(formulas = formulas) %>% mutate(mod = map(formulas, . function(fs) { . glm(as.formula(fs), family =
"binomial", data = mtcars) . }))
2. withVisible(eval(quote(`_fseq`(`_lhs`)), env, env))
3. eval(quote(`_fseq`(`_lhs`)), env, env)
4. eval(quote(`_fseq`(`_lhs`)), env, env)
5. `_fseq`(`_lhs`)
6. freduce(value, `_function_list`)
7. withVisible(function_list[[k]](value))
8. function_list[[k]](value)
9. mutate(., mod = map(formulas, function(fs) { . glm(as.formula(fs), family = "binomial", data = mtcars) . }))
10. mutate.data.frame(., mod = map(formulas, function(fs) { . glm(as.formula(fs), family = "binomial", data = mtcars) . }))
11. as.data.frame(mutate(tbl_df(.data), ...))
12. mutate(tbl_df(.data), ...)
13. mutate.tbl_df(tbl_df(.data), ...)
14. mutate_impl(.data, dots)
有人可以告诉我我在这里缺少什么吗?感谢您的任何建议。
问题是您使用的是 data.frame()
,默认情况下 (stringAsFactors=TRUE
) 会将您的公式向量转换为因子。
将 data.frame
更改为 data_frame
对我有用。 (data_frame
来自 tibble
包,也是通过 dplyr
导出的,所以它应该在 library("tidyverse")
之后可用)
您可以稍微缩短您的代码:
data_frame(formulas) %>%
mutate(mod = map(formulas,
~ glm(as.formula(.),
family = 'binomial', data = mtcars)))
我有一堆公式,作为字符串,我想在 glm 中一次使用一个,最好使用 tidyverse 函数。这是我现在的位置。
library(tidyverse)
library(broom)
mtcars %>% dplyr::select(mpg:qsec) %>% colnames -> targcols
paste('vs ~ ', targcols) -> formulas
formulas
#> 'vs ~ mpg' 'vs ~ cyl' 'vs ~ disp' 'vs ~ hp' 'vs ~ drat' 'vs ~ wt' 'vs ~ qsec'
我可以 运行 使用这些公式中的任何一个作为一般线性模型
glm(as.formula(formulas[1]), family = 'binomial', data = mtcars) %>% glance
#> null.deviance, df.null, logLik, AIC, BIC, deviance, df.residual
#> 43.86011, 31, -12.76667, 29.53334, 32.46481, 25.53334, 30
我想 运行 列表中每个可能的公式的 glm。我试过这样做。
data.frame(formulas = formulas) %>%
mutate(mod = map(formulas, function(fs){
glm(as.formula(fs), family = 'binomial', data = mtcars)
}))
但随后我收到以下错误消息:
Error in mutate_impl(.data, dots): Evaluation error: invalid formula. Traceback: 1. data.frame(formulas = formulas) %>% mutate(mod = map(formulas, . function(fs) { . glm(as.formula(fs), family = "binomial", data = mtcars) . })) 2. withVisible(eval(quote(`_fseq`(`_lhs`)), env, env)) 3. eval(quote(`_fseq`(`_lhs`)), env, env) 4. eval(quote(`_fseq`(`_lhs`)), env, env) 5. `_fseq`(`_lhs`) 6. freduce(value, `_function_list`) 7. withVisible(function_list[[k]](value)) 8. function_list[[k]](value) 9. mutate(., mod = map(formulas, function(fs) { . glm(as.formula(fs), family = "binomial", data = mtcars) . })) 10. mutate.data.frame(., mod = map(formulas, function(fs) { . glm(as.formula(fs), family = "binomial", data = mtcars) . })) 11. as.data.frame(mutate(tbl_df(.data), ...)) 12. mutate(tbl_df(.data), ...) 13. mutate.tbl_df(tbl_df(.data), ...) 14. mutate_impl(.data, dots)
有人可以告诉我我在这里缺少什么吗?感谢您的任何建议。
问题是您使用的是 data.frame()
,默认情况下 (stringAsFactors=TRUE
) 会将您的公式向量转换为因子。
将 data.frame
更改为 data_frame
对我有用。 (data_frame
来自 tibble
包,也是通过 dplyr
导出的,所以它应该在 library("tidyverse")
之后可用)
您可以稍微缩短您的代码:
data_frame(formulas) %>%
mutate(mod = map(formulas,
~ glm(as.formula(.),
family = 'binomial', data = mtcars)))