对多索引数据库文件求和

Sum multi-index database files

我正在尝试对 pandas 进行一些操作。我有一个国家列表,对于每个国家,我每年都有一些关于来自另一个国家的移民人数的数据。例如,AUS 2000 AFG 11160.0表示2000年澳大利亚有11116人来自阿富汗。

我打算按大陆对移民进行分组,因此预期结果将是 AUS 2000 Europeans 20000; Asians 16.000; Africans 3000... 等等。我该怎么做?

                Foreigners   
COU Year CO2                  
AUS 2000 AFG     11160.0 
         AGO       410.0  
         ALB      1530.0  
         AND        10.0  
         ARE      1390.0  
         ARG     11820.0  
         ARM       990.0  
AUS 2001 AFG

如果您的数据框具有 'COU'、'Year'、'CO2' 的多重索引,那么您可以使用:

df.sum(level=[0,1])

输出:

          Foreigners
COU Year            
AUS 2000     27310.0
    2001         1.0

或者如果您只想对 'COU' 求和而不是年份:

df.sum(level=0)

输出:

     Foreigners
COU            
AUS     27311.0