Python pandas:在我的数据框中添加一列来计算一个变量
Python pandas: Add a column to my dataframe that counts a variable
我有一个这样的数据框'gt':
org group
org1 1
org2 1
org3 2
org4 3
org5 3
org6 3
我想将列 'count' 添加到 gt 数据框以计算组的成员数量,预期结果如下:
org group count
org1 1 2
org2 1 2
org3 2 1
org4 3 3
org5 3 3
org6 3 3
我知道如何对组中的每一项进行计数,但不知道如何对所有组项目重复计数,这是我使用的代码:
gtcounts = gt.groupby('group').count()
有人可以帮忙吗?
调用 transform
这将 return 一个与原始 df 对齐的系列:
In [223]:
df['count'] = df.groupby('group')['group'].transform('count')
df
Out[223]:
org group count
0 org1 1 2
1 org2 1 2
2 org3 2 1
3 org4 3 3
4 org5 3 3
5 org6 3 3
我有一个这样的数据框'gt':
org group
org1 1
org2 1
org3 2
org4 3
org5 3
org6 3
我想将列 'count' 添加到 gt 数据框以计算组的成员数量,预期结果如下:
org group count
org1 1 2
org2 1 2
org3 2 1
org4 3 3
org5 3 3
org6 3 3
我知道如何对组中的每一项进行计数,但不知道如何对所有组项目重复计数,这是我使用的代码:
gtcounts = gt.groupby('group').count()
有人可以帮忙吗?
调用 transform
这将 return 一个与原始 df 对齐的系列:
In [223]:
df['count'] = df.groupby('group')['group'].transform('count')
df
Out[223]:
org group count
0 org1 1 2
1 org2 1 2
2 org3 2 1
3 org4 3 3
4 org5 3 3
5 org6 3 3