我需要 python 线性回归方面的帮助?
I need help in Linear regression with python?
所以我使用来自 kaggle 的红酒质量数据集来实现我所学到的关于线性回归的所有知识。这些是结果。由于 skew 的值为 0.3,我没有通过对数来转换我的目标。如您所见,我从 Dataframe 中删除了很多功能,因为它们的 P 值结果比结果高 0.05。删除超过限制的是否安全,或者有什么方法可以优化它们吗?到目前为止我做得好还是有什么错误?谢谢。
如果你的意思是排除系数不显着的变量,答案是肯定的。可以删除它们。如您所见,删除这些后结果变化不大,显然它们只会引入噪音。
所以我使用来自 kaggle 的红酒质量数据集来实现我所学到的关于线性回归的所有知识。这些是结果。由于 skew 的值为 0.3,我没有通过对数来转换我的目标。如您所见,我从 Dataframe 中删除了很多功能,因为它们的 P 值结果比结果高 0.05。删除超过限制的是否安全,或者有什么方法可以优化它们吗?到目前为止我做得好还是有什么错误?谢谢。
如果你的意思是排除系数不显着的变量,答案是肯定的。可以删除它们。如您所见,删除这些后结果变化不大,显然它们只会引入噪音。