Python - 用平均值替换缺失值

Python - Replace missing values with mean

作为初学者,我正在学习 python 课程。在本课程中,他们分别使用数据集 dataset。列名称:"Country"、"Age"、"Salary" 和 "Purchased"。 在第 2 和第 3 列(年龄和薪水)中有一些缺失值。对于 Python 开始计算 0 的列,我希望下面的代码可以完成这项工作:

from sklearn.preprocessing import Imputer 
imputer = Imputer(missing_values="NaN",strategy="mean", axis=0)
imputer=imputer.fit(X[:,1:2]) 
X[:,1:2] =imputer.transform(X[:,1:2])

然而,在这门课程中,他们说我们需要在所有地方使用 X[:,1:3],我不明白为什么。

这样做的原因是使用 [start:stop] 的切片将元素从 start 提取到 stop-1,所以

[0,1,2,3,4][1:2]

returns

[1]

所以如果你想要第二个和第三个元素,试试

[0,1,2,3,4][1:3]

希望对您有所帮助。