处理无数据值

Dealing with no data values

在学习过程中,none 个特征的值为“0”;所以我已经成功制作了我的 SVM 模型。

但是,当我使用该模型对我的特征进行预测时,样本的某些位置有“0”值。 “0”是没有数据值。如何在预测期间处理无数据值。我可以在学习过程中归因。但是,如果我在预测期间不删除任何数据值,我将在这些样本位置丢失预测结果。

在这些样本点中,并非所有特征都是无效的,但有些特征是无效的。 任何建议表示赞赏。

如果某些数据值为 NaN,那么您需要一个插补器来插补那些缺失值。一般策略是使用'mean'或'median'策略进行替换。

from sklearn.preprocessing import Imputer
imputer = Imputer(strategy='mean')
X_data = imputer.fit_transform(X_data_with_missing_values)

然后您可以使用此估算的 X_data 来拟合 SVM