如何在 R 中用 Inf/-Inf 预测数据?

how to predict data with Inf/-Inf in R?

我有一个包含 Inf/-inf 的可变证据权重的数据集(不幸的是)。我使用了线性回归,但是它无法训练,给出了错误

Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) : NA/NaN/Inf in 'y'

我正在寻找可以使用 Inf 进行训练并预测测试数据的 woe 值的模型。如果不可能,是否有其他 Inf 解决方案,如清理或变异?

您必须了解这些 Inf 案例的性质。

在大多数情况下,您可以将它们视为异常值。有很多技术可以解决这个问题。您可以将它们替换为 mean/median 值,您可以使用简单的线性回归模型预测该值,或者,如果 Inf 个实例在总观察中的百分比相对较低,您可以将它们排除在外。

希望这能带来一些清晰度。