Pandas：有没有办法使用 'droplevel' 之类的东西，并在此过程中使用删除的关卡标签将另一个关卡重命名为 prefix/suffix？

Question

以下查询的屏幕截图：

有没有一种方法可以轻松删除上层列索引，并在一个层级中使用 points_prev_amax、points_prev_amin、gf_prev_amax、gf_prev_amin 等标签等等？

Answer 1

使用 list comprehension 设置新的列名：

df.columns = df.columns.map('_'.join)

Or:

df.columns = ['_'.join(col) for col in df.columns]

样本：

df = pd.DataFrame({'A':[1,2,2,1],
                   'B':[4,5,6,4],
                   'C':[7,8,9,1],
                   'D':[1,3,5,9]})

print (df)
   A  B  C  D
0  1  4  7  1
1  2  5  8  3
2  2  6  9  5
3  1  4  1  9

df = df.groupby('A').agg([max, min])

df.columns = df.columns.map('_'.join)
print (df)
   B_max  B_min  C_max  C_min  D_max  D_min
A                                          
1      4      4      7      1      9      1
2      6      5      9      8      5      3

print (['_'.join(col) for col in df.columns])
['B_max', 'B_min', 'C_max', 'C_min', 'D_max', 'D_min']

df.columns = ['_'.join(col) for col in df.columns]
print (df)
   B_max  B_min  C_max  C_min  D_max  D_min
A                                          
1      4      4      7      1      9      1
2      6      5      9      8      5      3

如果需要 prefix 元组的简单交换项：

df.columns = ['_'.join((col[1], col[0])) for col in df.columns]
print (df)
   max_B  min_B  max_C  min_C  max_D  min_D
A                                          
1      4      4      7      1      9      1
2      6      5      9      8      5      3

另一个解决方案：

df.columns = ['{}_{}'.format(i[1], i[0]) for i in df.columns]
print (df)
   max_B  min_B  max_C  min_C  max_D  min_D
A                                          
1      4      4      7      1      9      1
2      6      5      9      8      5      3

如果 len 列很大 (10^6)，则使用 to_series and str.join:

df.columns = df.columns.to_series().str.join('_')

Answer 2

使用@jezrael 的设置

df = pd.DataFrame({'A':[1,2,2,1],
                   'B':[4,5,6,4],
                   'C':[7,8,9,1],
                   'D':[1,3,5,9]})

df = df.groupby('A').agg([max, min])

使用

分配新列

from itertools import starmap

def flat(midx, sep=''):
    fstr = sep.join(['{}'] * midx.nlevels)
    return pd.Index(starmap(fstr.format, midx))

df.columns = flat(df.columns, '_')

df

Pandas：有没有办法使用 'droplevel' 之类的东西，并在此过程中使用删除的关卡标签将另一个关卡重命名为 prefix/suffix？

Pandas: Is there a way to use something like 'droplevel' and in process, rename the other level using the dropped level labels as prefix/suffix?

python

rename

multiple-columns

multi-index

pandas