如何删除 pandas 数据框中重复的行?

How to remove rows with duplicates in pandas dataframe?

有一个数据框在两列(AB)中包含重复值:

A B
1 2
2 3
4 5
7 6
5 8

我想删除重复项,以便只保留唯一值:

A B
1 2
4 5
7 6

这个命令没有提供我想要的:

df.drop_duplicates(subset=['A','B'], keep='first')

知道怎么做吗?

您可以使用 stack with unstack:

print (df.stack().drop_duplicates().unstack().dropna().astype(int))
   A  B
0  1  2
2  4  5
3  7  6

boolean indexing 的解决方案:

print (df[~df.stack().duplicated().unstack().any(1)])
   A  B
0  1  2
2  4  5
3  7  6