是一种没有虚拟陷阱的热编码

is one hot encoding is free of the dummy trap

在一个热编码器中有一种叫做虚拟陷阱的东西,当我们用 3 个类别对分类列进行编码时,比如 a、b 和 c,然后使用一个热编码器,我们得到 3 个类别,例如 a、b 列, 和 c 但是当我们使用 get_dummies 时,我们得到 2 列而不是 a 和 b 然后它是从虚拟陷阱中保存的。是一种暴露于虚拟陷阱的热编码,或者它会处理它。我对吗?哪个是虚拟陷阱的保存?或者是否可以将两者与我们的删除列一起使用,我将数据集用于许多算法。

寻求帮助。提前致谢。

OneHotEncoder 不能直接处理字符串值。如果你的标称特征是字符串,那么你需要先将它们映射成整数。

pandas.get_dummies 正好相反。默认情况下,它只将字符串列转换为单热表示,除非指定列。