如何在 Python 中创建标签(自动编码)

How to create labels (auto encoding) in Python

我有这样一个数据框:

Name  subname Feature1  Feature2 ...
AAA     a     0.123     0.345 ...
AAA     b     0.123     0.345 ...
BBB     a     0.123     0.345 ...
BBB     b     0.123     0.345 ...

我想创建标签(添加新列):

Name  subname Feature1  Feature2 ...Class
AAA     a     0.123     0.345 ...    1
AAA     b     0.123     0.345 ...    1
BBB     a     0.123     0.345 ...    2
BBB     b     0.123     0.345 ...    2

这样我就可以将数据放入分类模型中,有没有一种方法可以有效地创建这些标签?我得到了 5000 多行,非常感谢。

你可以试试

labels, uniques = pd.factorize(df['Name'].tolist())
df['labels'] = labels

并且会得到一个 array([0, 0, 1, 1])