列中唯一值的布尔值

Question

对于我的数据框，例如

df = pd.DataFrame([1, 3, 7, 1], columns=['data'])

我想知道每个索引的值在 data 列中是否唯一。

所以生成的数据帧应该是

    data    is_unique
0   1       False
1   3       True
2   7       True
3   1       False

pandas有什么方便的方法吗？

Answer 1

使用 duplicated 和反转掩码 ~:

df['is_unique'] = ~df['data'].duplicated(keep=False)
print (df)

   data  is_unique
0     1      False
1     3       True
2     7       True
3     1      False

Answer 2

通过使用 value_counts + map

df.assign(BOOL=df.data.map(df.data.value_counts()>1))
Out[437]: 
   data   BOOL
0     1   True
1     3  False
2     7  False
3     1   True

通过使用drop_duplicate

df.assign(BOOL=df.index.isin(df.drop_duplicates('data',keep =False).index))

Out[440]: 
   data   BOOL
0     1  False
1     3   True
2     7   True
3     1  False

Answer 3

from collections import Counter

c = Counter(df.client.to_list())

df["new_col"] = df.client.apply(lambda x:not(c[x] >1) )

列中唯一值的布尔值

Boolean for unique value in a column

python

unique

dataframe

pandas