数据集中子集的线性回归模型?
Linear regression model for subset within dataset?
我有一个数据集,其中包含 300 多个不同车型、一些汽车、一些自行车和 10 多行特征(颜色、尺寸、mpg 等)的条目。
如果 cars/bikes 实际上没有在数据集中分类(尽管它是有序的,即只有 1:200 列是汽车,201:300 列是自行车)。
我想我需要创建我的数据集的一个子集,但我不知道如何将原始数据集中的特征与子集相关联。
如果解释不当,我们深表歉意,感谢您的帮助!
我认为你应该首先重组你的数据框(你可能想在行中查看车辆模型,在列中查看特征。我建议使用 t()
作为转置函数,然后添加另一个带有虚拟变量的列(1 如果car type is car and 0 if not). 现在,如果您想拟合逻辑回归,则可以使用 glm()
或 lm()
进行线性回归,从而对 mpg 上的汽车类型进行回归。
我有一个数据集,其中包含 300 多个不同车型、一些汽车、一些自行车和 10 多行特征(颜色、尺寸、mpg 等)的条目。
如果 cars/bikes 实际上没有在数据集中分类(尽管它是有序的,即只有 1:200 列是汽车,201:300 列是自行车)。
我想我需要创建我的数据集的一个子集,但我不知道如何将原始数据集中的特征与子集相关联。
如果解释不当,我们深表歉意,感谢您的帮助!
我认为你应该首先重组你的数据框(你可能想在行中查看车辆模型,在列中查看特征。我建议使用 t()
作为转置函数,然后添加另一个带有虚拟变量的列(1 如果car type is car and 0 if not). 现在,如果您想拟合逻辑回归,则可以使用 glm()
或 lm()
进行线性回归,从而对 mpg 上的汽车类型进行回归。