对多索引数据库文件求和

Question

我正在尝试对 pandas 进行一些操作。我有一个国家列表，对于每个国家，我每年都有一些关于来自另一个国家的移民人数的数据。例如，AUS 2000 AFG 11160.0表示2000年澳大利亚有11116人来自阿富汗。

我打算按大陆对移民进行分组，因此预期结果将是 AUS 2000 Europeans 20000; Asians 16.000; Africans 3000... 等等。我该怎么做？

                Foreigners   
COU Year CO2                  
AUS 2000 AFG     11160.0 
         AGO       410.0  
         ALB      1530.0  
         AND        10.0  
         ARE      1390.0  
         ARG     11820.0  
         ARM       990.0  
AUS 2001 AFG

Answer 1

如果您的数据框具有 'COU'、'Year'、'CO2' 的多重索引，那么您可以使用：

df.sum(level=[0,1])

输出：

          Foreigners
COU Year            
AUS 2000     27310.0
    2001         1.0

或者如果您只想对 'COU' 求和而不是年份：

df.sum(level=0)

输出：

     Foreigners
COU            
AUS     27311.0

对多索引数据库文件求和

Sum multi-index database files

python

database

pandas

pandas-groupby