使用 python 创建模型时处理 NAN 值

Deal with NAN values when creating models with python

我必须通过变量矩阵 (X) 来解释变量 (Y)。我的 Y 中有 NAN 值,这是需要解释的变量。我的 NAN 值占我观察值的一半。 我应该删除 Y 的 NAN 行吗?

X:(整数矩阵)已清理且不包含 NAN 值。 Y:需要(是,否,NAN)。 我该怎么做

谢谢你!!

要回答这个问题,我认为你需要回答更基本的问题 "is Y=NaN a label?"

如果您希望训练模型预测三个标签(是、否、NaN)之一,则用标签填充 NaN(例如 "Missing")。如果您不这样做(是或否),那么我看不出您如何在没有目标的情况下进行观察训练。放下那些并训练其余的。