Pandas:在数据透视表中从另一列中减去一列 table
Pandas: subtract one column from another in a pivot table
我想在数据透视表中从另一列中减去一列 table。 'diff'应该是2017年和2016年的区别
raw_data = {'year': [2016,2016,2017,2017],
'area': ['A','B','A','B'],
'age': [10,12,50,52]}
df1 = pd.DataFrame(raw_data, columns = ['year','area','age'])
table=pd.pivot_table(df1,index=['area'],columns=['year'],values['age'],aggfunc='mean')
table['diff']=table['2017']-table['2016']
您需要删除 pivot_table
中的 []
,以免在以下列中创建 MultiIndex
:
table=pd.pivot_table(df1,index='area',columns='year',values='age',aggfunc='mean')
print (table)
year 2016 2017
area
A 10 50
B 12 52
table['diff']=table[2017]-table[2016]
print (table)
year 2016 2017 diff
area
A 10 50 40
B 12 52 40
另一个可能的解决方案是 droplevel
:
table=pd.pivot_table(df1,index=['area'],columns=['year'],values=['age'],aggfunc='mean')
table.columns = table.columns.droplevel(0)
print (table)
year 2016 2017
area
A 10 50
B 12 52
我想在数据透视表中从另一列中减去一列 table。 'diff'应该是2017年和2016年的区别
raw_data = {'year': [2016,2016,2017,2017],
'area': ['A','B','A','B'],
'age': [10,12,50,52]}
df1 = pd.DataFrame(raw_data, columns = ['year','area','age'])
table=pd.pivot_table(df1,index=['area'],columns=['year'],values['age'],aggfunc='mean')
table['diff']=table['2017']-table['2016']
您需要删除 pivot_table
中的 []
,以免在以下列中创建 MultiIndex
:
table=pd.pivot_table(df1,index='area',columns='year',values='age',aggfunc='mean')
print (table)
year 2016 2017
area
A 10 50
B 12 52
table['diff']=table[2017]-table[2016]
print (table)
year 2016 2017 diff
area
A 10 50 40
B 12 52 40
另一个可能的解决方案是 droplevel
:
table=pd.pivot_table(df1,index=['area'],columns=['year'],values=['age'],aggfunc='mean')
table.columns = table.columns.droplevel(0)
print (table)
year 2016 2017
area
A 10 50
B 12 52