使用 python 创建模型时处理 NAN 值
Deal with NAN values when creating models with python
我必须通过变量矩阵 (X) 来解释变量 (Y)。我的 Y 中有 NAN 值,这是需要解释的变量。我的 NAN 值占我观察值的一半。
我应该删除 Y 的 NAN 行吗?
X:(整数矩阵)已清理且不包含 NAN 值。
Y:需要(是,否,NAN)。
我该怎么做
谢谢你!!
要回答这个问题,我认为你需要回答更基本的问题 "is Y=NaN a label?"
如果您希望训练模型预测三个标签(是、否、NaN)之一,则用标签填充 NaN(例如 "Missing")。如果您不这样做(是或否),那么我看不出您如何在没有目标的情况下进行观察训练。放下那些并训练其余的。
我必须通过变量矩阵 (X) 来解释变量 (Y)。我的 Y 中有 NAN 值,这是需要解释的变量。我的 NAN 值占我观察值的一半。 我应该删除 Y 的 NAN 行吗?
X:(整数矩阵)已清理且不包含 NAN 值。 Y:需要(是,否,NAN)。 我该怎么做
谢谢你!!
要回答这个问题,我认为你需要回答更基本的问题 "is Y=NaN a label?"
如果您希望训练模型预测三个标签(是、否、NaN)之一,则用标签填充 NaN(例如 "Missing")。如果您不这样做(是或否),那么我看不出您如何在没有目标的情况下进行观察训练。放下那些并训练其余的。