多元回归遗漏一个变量(列)

Multiple regression leave out one variable (column)

如果数据框中有很多列,而您想只省略一两列,而将其他所有内容都包含在多元回归中,我们如何在不写出大公式的情况下实现这一点?

例如包括所有:

lm(y ~., data=myFrame)

那么如果你想一个一个地挑选

lm(y ~ x1 + x2 + x3)

但是如果你有 50 个变量但想省略几个变量,最好的方法是什么?因为我想省去两三个,把剩下的都包括进去,然后做正向和反向选择。

对 "everything in the data frame except the response variable" 使用 . 运算符,对 "but leave these out" 使用 - 运算符 ...

lm(y ~ . - excluded_1 - excluded_2, data = myFrame)

您可以使用 R 的内置子集:

all.but.x1x2x3 <- myFrame[, !(colnames(myFrame) %in% c('x1', 'x2', 'x3'))]
lm(y ~., data=all.but.x1x2x3)