如何将删除重复数据的 python pandas 列保存为 csv?
How to save python pandas column de-duped to csv?
使用简单的数据框 df:
ID | other columns
123
123
343
345
234
234
我想将第一列保存到 csv 但已删除重复数据。
df['ID'].to_csv('file.csv')
如何在保存前去重?谢谢
您可以使用 unique elements
或 drop_duplicates
来获取 ID 的唯一列表
df['ID'].unique().to_csv('file.csv')
需要 DataFrame.drop_duplicates
如果 ID
是列:
df.drop_duplicates(subset=['ID']).to_csv('file.csv')
如果ID
是索引需要Index.duplicated
:
df = df[~df.index.duplicated()].to_csv('file.csv')
使用简单的数据框 df:
ID | other columns
123
123
343
345
234
234
我想将第一列保存到 csv 但已删除重复数据。
df['ID'].to_csv('file.csv')
如何在保存前去重?谢谢
您可以使用 unique elements
或 drop_duplicates
来获取 ID 的唯一列表
df['ID'].unique().to_csv('file.csv')
需要 DataFrame.drop_duplicates
如果 ID
是列:
df.drop_duplicates(subset=['ID']).to_csv('file.csv')
如果ID
是索引需要Index.duplicated
:
df = df[~df.index.duplicated()].to_csv('file.csv')