Excel 中分类数据的单热(虚拟)编码

One-hot (dummy) encoding of categorical data in Excel

如何将分类数据转换为单热编码数字格式。输出格式如下图所示:

是否可以自动提取数据 classes 并为每个 class 创建列,而无需在 [=17] 中手动创建所有列(白色、红色、黑色...) =]?

你可以用公式来做

根据你上面的图片,你可以在单元格 E2 中写入

 =INDEX($B:$B,COLUMN(H:H)-COLUMN($E:$E))    'DRAG FORMULA ACROSS AS NEEDED

在单元格 D3 中使用

=A3                                         'DRAG FORMULA DOWN AS NEEDED

并在单元格 E3 中使用

=IF($B3=E,1,0)                   'DRAG FORMULA ACROSS AND DOWN AS NEEDED