pandas groupby 和布尔选择
pandas groupby and boolean selection
我经常在 pandas
中做这样的事情:
s2 = s1.groupby(level=1).sum()
s2 = s2[s2>25]
换句话说,我做了一些groupby
操作,然后想只保留满足某些条件的结果。
有没有办法在一行中完成?更具体地说,是否可以在不创建系列然后在第二步中进行布尔选择的情况下执行此操作?
假设 s1
是 pandas.Series
- 您可以将
level
传递给 pd.Series.sum
pd.Series.compress
很方便
s2.sum(level=1).compress(lambda s: s.gt(25))
假设 s1
是 pandas.DataFrame
还有一个列名'col'
s.sum(level=1).query('col > 25')
.loc
+ lambda
系列
df.groupby('name').a.sum().loc[lambda x: x>20]
Out[492]:
name
Chn 84
Fra 165
Ind 71
数据框
df.groupby('name').a.sum().to_frame().loc[lambda x: x['a']>20]
Out[490]:
a
name
Chn 84
Fra 165
Ind 71
数据输入
df=pd.DataFrame({'name':['Ind','Chn','SG','US','SG','US','Ind','Chn','Fra','Fra'],'a':[5,6,3,4,7,12,66,78,65,100]})
我经常在 pandas
中做这样的事情:
s2 = s1.groupby(level=1).sum()
s2 = s2[s2>25]
换句话说,我做了一些groupby
操作,然后想只保留满足某些条件的结果。
有没有办法在一行中完成?更具体地说,是否可以在不创建系列然后在第二步中进行布尔选择的情况下执行此操作?
假设 s1
是 pandas.Series
- 您可以将
level
传递给pd.Series.sum
pd.Series.compress
很方便
s2.sum(level=1).compress(lambda s: s.gt(25))
假设 s1
是 pandas.DataFrame
还有一个列名'col'
s.sum(level=1).query('col > 25')
.loc
+ lambda
系列
df.groupby('name').a.sum().loc[lambda x: x>20]
Out[492]:
name
Chn 84
Fra 165
Ind 71
数据框
df.groupby('name').a.sum().to_frame().loc[lambda x: x['a']>20]
Out[490]:
a
name
Chn 84
Fra 165
Ind 71
数据输入
df=pd.DataFrame({'name':['Ind','Chn','SG','US','SG','US','Ind','Chn','Fra','Fra'],'a':[5,6,3,4,7,12,66,78,65,100]})