处理 ML 分类列中的 infinite/large 个值

Handling infinite/large values in column for ML classification

使用公式计算了一个列(公式不涉及任何日志函数,只是一个分组 .sum()),但正如预期的那样,此列将导致 infinite/exponential values,如下所示:

-inf
 nan
 inf
-3.000e+32
 7.3297+23 ...etc (similar data)

我的疑问是对于二元分类问题,我应该如何将此列作为 I could also not avoid this column for prediction 来处理。在模型分类器中使用此列之前需要使用哪些技术。

谢谢!

如果你的函数计算一个特征(列)returns naninf 我会怀疑。为什么会这样?

一般来说,如果您有像您这样的大值,您可以尝试应用 log-transformation 将您的值缩小到更有用的区间。