循环分组数据框中的组

Looping over groups in a grouped dataframe

考虑这个小例子:

data={"X":[1, 2, 3, 4, 5], "Y":[6, 7, 8, 9, 10], "Z": [11, 12, 13, 14, 15])
frame=pd.DataFrame(data,columns=["X","Y","Z"],index=["A","A","A","B","B"])

我想将 frame

分组
grouped=frame.groupby(frame.index)

然后我想通过以下方式遍历组:

for group in grouped:

但我被困在下一步:如何在每个循环中提取 group 作为 pandas DataFrame 以便我可以进一步处理它?

df.groupby returns 二元组的可迭代:索引和组。您可以像这样遍历每个组:

for _, g in frame.groupby(frame.index):
    .... # do something with `g`

但是,如果您想对组执行一些操作,可能有比迭代更好的方法。

这是一个例子:

groups = frame.groupby(level=0)

for n,g in groups:
    print('This is group '+ str(n)+'.')
    print(g)
    print('\n')

输出:

This is group A.
   X  Y   Z
A  1  6  11
A  2  7  12
A  3  8  13


This is group B.
   X   Y   Z
B  4   9  14
B  5  10  15