数据集中子集的线性回归模型?

Linear regression model for subset within dataset?

我有一个数据集,其中包含 300 多个不同车型、一些汽车、一些自行车和 10 多行特征(颜色、尺寸、mpg 等)的条目。

如果 cars/bikes 实际上没有在数据集中分类(尽管它是有序的,即只有 1:200 列是汽车,201:300 列是自行车)。

我想我需要创建我的数据集的一个子集,但我不知道如何将原始数据集中的特征与子集相关联。

如果解释不当,我们深表歉意,感谢您的帮助!

我认为你应该首先重组你的数据框(你可能想在行中查看车辆模型,在列中查看特征。我建议使用 t() 作为转置函数,然后添加另一个带有虚拟变量的列(1 如果car type is car and 0 if not). 现在,如果您想拟合逻辑回归,则可以使用 glm()lm() 进行线性回归,从而对 mpg 上的汽车类型进行回归。