处理 ML 分类列中的 infinite/large 个值
Handling infinite/large values in column for ML classification
使用公式计算了一个列(公式不涉及任何日志函数,只是一个分组 .sum()
),但正如预期的那样,此列将导致 infinite/exponential values
,如下所示:
-inf
nan
inf
-3.000e+32
7.3297+23 ...etc (similar data)
我的疑问是对于二元分类问题,我应该如何将此列作为 I could also not avoid this column for prediction
来处理。在模型分类器中使用此列之前需要使用哪些技术。
谢谢!
如果你的函数计算一个特征(列)returns nan
或 inf
我会怀疑。为什么会这样?
一般来说,如果您有像您这样的大值,您可以尝试应用 log-transformation 将您的值缩小到更有用的区间。
使用公式计算了一个列(公式不涉及任何日志函数,只是一个分组 .sum()
),但正如预期的那样,此列将导致 infinite/exponential values
,如下所示:
-inf
nan
inf
-3.000e+32
7.3297+23 ...etc (similar data)
我的疑问是对于二元分类问题,我应该如何将此列作为 I could also not avoid this column for prediction
来处理。在模型分类器中使用此列之前需要使用哪些技术。
谢谢!
如果你的函数计算一个特征(列)returns nan
或 inf
我会怀疑。为什么会这样?
一般来说,如果您有像您这样的大值,您可以尝试应用 log-transformation 将您的值缩小到更有用的区间。