如何使用 tidyverse 运行 对两个变量的组合和 return 具有 p 值和每个模型的 r 平方的数据框进行建模
how to run models on combinations of two variables and return a dataframe with p-values and r-square for each model using tidyverse
我正在尝试 运行 基于不同变量组合的模型。我想要一个包含 3 列的数据框:每个模型的变量、p 值和 r 方。我以 mtcars 数据集为例。这是我的代码:
c('wt', 'hp', 'qsec') %>%
combn(2, paste, collapse='*') %>%
structure(., names=.) %>%
map(~formula(paste('mpg~', .x))) %>%
map(lm, data=mtcars) %>%
map(~coef(summary(.x))[4,4]) %>%
unlist() %>%
data.frame(p.value=.) %>%
rownames_to_column(var='interaction')
这是我的输出:
interaction p.value
1 wt*hp 0.0008108307
2 wt*qsec 0.2652596233
3 hp*qsec 0.0001411028
问题是如何在从每个模型中提取 r 平方后向数据框添加另一列?我想在上面的链接操作中实现这一点。因为我希望将这种方法推广到其他类型的模型,所以我想在不使用 broom 包的情况下做到这一点。如果有人可以帮助我,我将不胜感激。非常感谢。
我们可以使用broom
包函数,如glance
、tidy
library(broom)
library(tidyverse)
v1 %>%
combn(2, paste, collapse='*') %>%
structure(., names=.) %>%
map(~summary(lm(formula(paste('mpg~', .x)), data = mtcars))) %>%
map(~ data.frame( tidy(.)[4,]['p.value'], glance(.)['r.squared'])) %>%
bind_rows(., .id = 'interaction')
# interaction p.value r.squared
#1 wt*hp 0.0008108307 0.8847637
#2 wt*qsec 0.2652596233 0.8340742
#3 hp*qsec 0.0001411028 0.7854734
数据
v1 <- c('wt', 'hp', 'qsec')
我会尝试关注
library(tidyverse)
reg.vars <- c('wt', 'hp', 'qsec')
tibble(interaction = combn(reg.vars, 2, paste, collapse = '*')) %>%
mutate(fit = map(interaction, ~ summary(lm(paste('mpg ~', .), data = mtcars))),
pval = map_dbl(fit, ~ coef(.)[4, 4]),
rsq = map_dbl(fit, ~ .$r.squared)) %>%
select(-fit)
# # A tibble: 3 x 3
# interaction pval rsq
# <chr> <dbl> <dbl>
# 1 wt*hp 0.0008108307 0.8847637
# 2 wt*qsec 0.2652596233 0.8340742
# 3 hp*qsec 0.0001411028 0.7854734
我正在尝试 运行 基于不同变量组合的模型。我想要一个包含 3 列的数据框:每个模型的变量、p 值和 r 方。我以 mtcars 数据集为例。这是我的代码:
c('wt', 'hp', 'qsec') %>%
combn(2, paste, collapse='*') %>%
structure(., names=.) %>%
map(~formula(paste('mpg~', .x))) %>%
map(lm, data=mtcars) %>%
map(~coef(summary(.x))[4,4]) %>%
unlist() %>%
data.frame(p.value=.) %>%
rownames_to_column(var='interaction')
这是我的输出:
interaction p.value
1 wt*hp 0.0008108307
2 wt*qsec 0.2652596233
3 hp*qsec 0.0001411028
问题是如何在从每个模型中提取 r 平方后向数据框添加另一列?我想在上面的链接操作中实现这一点。因为我希望将这种方法推广到其他类型的模型,所以我想在不使用 broom 包的情况下做到这一点。如果有人可以帮助我,我将不胜感激。非常感谢。
我们可以使用broom
包函数,如glance
、tidy
library(broom)
library(tidyverse)
v1 %>%
combn(2, paste, collapse='*') %>%
structure(., names=.) %>%
map(~summary(lm(formula(paste('mpg~', .x)), data = mtcars))) %>%
map(~ data.frame( tidy(.)[4,]['p.value'], glance(.)['r.squared'])) %>%
bind_rows(., .id = 'interaction')
# interaction p.value r.squared
#1 wt*hp 0.0008108307 0.8847637
#2 wt*qsec 0.2652596233 0.8340742
#3 hp*qsec 0.0001411028 0.7854734
数据
v1 <- c('wt', 'hp', 'qsec')
我会尝试关注
library(tidyverse)
reg.vars <- c('wt', 'hp', 'qsec')
tibble(interaction = combn(reg.vars, 2, paste, collapse = '*')) %>%
mutate(fit = map(interaction, ~ summary(lm(paste('mpg ~', .), data = mtcars))),
pval = map_dbl(fit, ~ coef(.)[4, 4]),
rsq = map_dbl(fit, ~ .$r.squared)) %>%
select(-fit)
# # A tibble: 3 x 3
# interaction pval rsq
# <chr> <dbl> <dbl>
# 1 wt*hp 0.0008108307 0.8847637
# 2 wt*qsec 0.2652596233 0.8340742
# 3 hp*qsec 0.0001411028 0.7854734