如何将删除重复数据的 python pandas 列保存为 csv？

Question

使用简单的数据框 df：

ID | other columns
123
123
343
345
234
234

我想将第一列保存到 csv 但已删除重复数据。

df['ID'].to_csv('file.csv')

如何在保存前去重？谢谢

Answer 1

您可以使用 unique elements 或 drop_duplicates 来获取 ID 的唯一列表

df['ID'].unique().to_csv('file.csv')

Answer 2

需要 DataFrame.drop_duplicates 如果 ID 是列：

df.drop_duplicates(subset=['ID']).to_csv('file.csv')

如果ID是索引需要Index.duplicated:

df = df[~df.index.duplicated()].to_csv('file.csv')

How to save python pandas column de-duped to csv?