Python - 用平均值替换缺失值
Python - Replace missing values with mean
作为初学者,我正在学习 python 课程。在本课程中,他们分别使用数据集 dataset。列名称:"Country"、"Age"、"Salary" 和 "Purchased"。
在第 2 和第 3 列(年龄和薪水)中有一些缺失值。对于 Python 开始计算 0 的列,我希望下面的代码可以完成这项工作:
from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values="NaN",strategy="mean", axis=0)
imputer=imputer.fit(X[:,1:2])
X[:,1:2] =imputer.transform(X[:,1:2])
然而,在这门课程中,他们说我们需要在所有地方使用 X[:,1:3],我不明白为什么。
这样做的原因是使用 [start:stop]
的切片将元素从 start
提取到 stop-1
,所以
[0,1,2,3,4][1:2]
returns
[1]
所以如果你想要第二个和第三个元素,试试
[0,1,2,3,4][1:3]
希望对您有所帮助。
作为初学者,我正在学习 python 课程。在本课程中,他们分别使用数据集 dataset。列名称:"Country"、"Age"、"Salary" 和 "Purchased"。 在第 2 和第 3 列(年龄和薪水)中有一些缺失值。对于 Python 开始计算 0 的列,我希望下面的代码可以完成这项工作:
from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values="NaN",strategy="mean", axis=0)
imputer=imputer.fit(X[:,1:2])
X[:,1:2] =imputer.transform(X[:,1:2])
然而,在这门课程中,他们说我们需要在所有地方使用 X[:,1:3],我不明白为什么。
这样做的原因是使用 [start:stop]
的切片将元素从 start
提取到 stop-1
,所以
[0,1,2,3,4][1:2]
returns
[1]
所以如果你想要第二个和第三个元素,试试
[0,1,2,3,4][1:3]
希望对您有所帮助。