循环分组数据框中的组
Looping over groups in a grouped dataframe
考虑这个小例子:
data={"X":[1, 2, 3, 4, 5], "Y":[6, 7, 8, 9, 10], "Z": [11, 12, 13, 14, 15])
frame=pd.DataFrame(data,columns=["X","Y","Z"],index=["A","A","A","B","B"])
我想将 frame
与
分组
grouped=frame.groupby(frame.index)
然后我想通过以下方式遍历组:
for group in grouped:
但我被困在下一步:如何在每个循环中提取 group
作为 pandas DataFrame 以便我可以进一步处理它?
df.groupby
returns 二元组的可迭代:索引和组。您可以像这样遍历每个组:
for _, g in frame.groupby(frame.index):
.... # do something with `g`
但是,如果您想对组执行一些操作,可能有比迭代更好的方法。
这是一个例子:
groups = frame.groupby(level=0)
for n,g in groups:
print('This is group '+ str(n)+'.')
print(g)
print('\n')
输出:
This is group A.
X Y Z
A 1 6 11
A 2 7 12
A 3 8 13
This is group B.
X Y Z
B 4 9 14
B 5 10 15
考虑这个小例子:
data={"X":[1, 2, 3, 4, 5], "Y":[6, 7, 8, 9, 10], "Z": [11, 12, 13, 14, 15])
frame=pd.DataFrame(data,columns=["X","Y","Z"],index=["A","A","A","B","B"])
我想将 frame
与
grouped=frame.groupby(frame.index)
然后我想通过以下方式遍历组:
for group in grouped:
但我被困在下一步:如何在每个循环中提取 group
作为 pandas DataFrame 以便我可以进一步处理它?
df.groupby
returns 二元组的可迭代:索引和组。您可以像这样遍历每个组:
for _, g in frame.groupby(frame.index):
.... # do something with `g`
但是,如果您想对组执行一些操作,可能有比迭代更好的方法。
这是一个例子:
groups = frame.groupby(level=0)
for n,g in groups:
print('This is group '+ str(n)+'.')
print(g)
print('\n')
输出:
This is group A.
X Y Z
A 1 6 11
A 2 7 12
A 3 8 13
This is group B.
X Y Z
B 4 9 14
B 5 10 15