多元回归遗漏一个变量(列)
Multiple regression leave out one variable (column)
如果数据框中有很多列,而您想只省略一两列,而将其他所有内容都包含在多元回归中,我们如何在不写出大公式的情况下实现这一点?
例如包括所有:
lm(y ~., data=myFrame)
那么如果你想一个一个地挑选
lm(y ~ x1 + x2 + x3)
但是如果你有 50 个变量但想省略几个变量,最好的方法是什么?因为我想省去两三个,把剩下的都包括进去,然后做正向和反向选择。
对 "everything in the data frame except the response variable" 使用 .
运算符,对 "but leave these out" 使用 -
运算符 ...
lm(y ~ . - excluded_1 - excluded_2, data = myFrame)
您可以使用 R 的内置子集:
all.but.x1x2x3 <- myFrame[, !(colnames(myFrame) %in% c('x1', 'x2', 'x3'))]
lm(y ~., data=all.but.x1x2x3)
如果数据框中有很多列,而您想只省略一两列,而将其他所有内容都包含在多元回归中,我们如何在不写出大公式的情况下实现这一点?
例如包括所有:
lm(y ~., data=myFrame)
那么如果你想一个一个地挑选
lm(y ~ x1 + x2 + x3)
但是如果你有 50 个变量但想省略几个变量,最好的方法是什么?因为我想省去两三个,把剩下的都包括进去,然后做正向和反向选择。
对 "everything in the data frame except the response variable" 使用 .
运算符,对 "but leave these out" 使用 -
运算符 ...
lm(y ~ . - excluded_1 - excluded_2, data = myFrame)
您可以使用 R 的内置子集:
all.but.x1x2x3 <- myFrame[, !(colnames(myFrame) %in% c('x1', 'x2', 'x3'))]
lm(y ~., data=all.but.x1x2x3)