对多索引数据库文件求和
Sum multi-index database files
我正在尝试对 pandas 进行一些操作。我有一个国家列表,对于每个国家,我每年都有一些关于来自另一个国家的移民人数的数据。例如,AUS 2000 AFG 11160.0
表示2000年澳大利亚有11116人来自阿富汗。
我打算按大陆对移民进行分组,因此预期结果将是 AUS 2000 Europeans 20000; Asians 16.000; Africans 3000...
等等。我该怎么做?
Foreigners
COU Year CO2
AUS 2000 AFG 11160.0
AGO 410.0
ALB 1530.0
AND 10.0
ARE 1390.0
ARG 11820.0
ARM 990.0
AUS 2001 AFG
如果您的数据框具有 'COU'、'Year'、'CO2' 的多重索引,那么您可以使用:
df.sum(level=[0,1])
输出:
Foreigners
COU Year
AUS 2000 27310.0
2001 1.0
或者如果您只想对 'COU' 求和而不是年份:
df.sum(level=0)
输出:
Foreigners
COU
AUS 27311.0
我正在尝试对 pandas 进行一些操作。我有一个国家列表,对于每个国家,我每年都有一些关于来自另一个国家的移民人数的数据。例如,AUS 2000 AFG 11160.0
表示2000年澳大利亚有11116人来自阿富汗。
我打算按大陆对移民进行分组,因此预期结果将是 AUS 2000 Europeans 20000; Asians 16.000; Africans 3000...
等等。我该怎么做?
Foreigners
COU Year CO2
AUS 2000 AFG 11160.0
AGO 410.0
ALB 1530.0
AND 10.0
ARE 1390.0
ARG 11820.0
ARM 990.0
AUS 2001 AFG
如果您的数据框具有 'COU'、'Year'、'CO2' 的多重索引,那么您可以使用:
df.sum(level=[0,1])
输出:
Foreigners
COU Year
AUS 2000 27310.0
2001 1.0
或者如果您只想对 'COU' 求和而不是年份:
df.sum(level=0)
输出:
Foreigners
COU
AUS 27311.0