对多索引数据框的列进行排序
Sorting columns of multiindex dataframe
我有一个非常大的多索引数据框,大约有 500 列,每列有 2 个子列。
数据框 df
看起来像:
B2 B5 B3
bkt A1 A2 A2 A1 Z2 C1
Date
2019-06-11 0.8 0.2 -6.0 -0.8 -4.1 -0.6
2019-06-12 0.8 0.2 -6.9 -1.6 -5.3 -1.2
df.columns
MultiIndex(levels=[['B2', 'B5', 'B3', .....], ['A1', 'A2' ......]],
labels=[[1, 1, ....], [1, 0, ....]],
names=[None, 'bkt'])
我正在尝试仅对列名进行排序并保持每列中的值以获得以下所需输出:
B2 B3 B5
bkt A1 A2 C1 Z2 A1 A2
Date
2019-06-11 ..
2019-06-12 ..
..
表示原始数据帧中的值。我只是没有重新输入它们。
设置
df = pd.DataFrame([
[.8, .2, -6., -.8, -4.1, -.6],
[.8, .2, -6.9, -1.6, -5.3, -1.2]
],
pd.date_range('2019-06-11', periods=2, name='Date'),
pd.MultiIndex.from_arrays([
'B2 B2 B5 B5 B3 B3'.split(),
'A1 A2 A2 A1 Z2 C1'.split()
], names=[None, 'bkt'])
)
使用 sort_index
并将其分配回去
df.columns=df.sort_index(axis=1,level=[0,1],ascending=[True,False]).columns
并且从 piR 开始,我们不需要创建 df 的副本,只需对列进行修改
df.columns=df.columns.sort_values(ascending=[True, False])
这应该使用 sort_index
移动列名和数据来完成:
df.sort_index(axis=1, level=[0, 1], ascending=[True, False], inplace=True)
我有一个非常大的多索引数据框,大约有 500 列,每列有 2 个子列。
数据框 df
看起来像:
B2 B5 B3
bkt A1 A2 A2 A1 Z2 C1
Date
2019-06-11 0.8 0.2 -6.0 -0.8 -4.1 -0.6
2019-06-12 0.8 0.2 -6.9 -1.6 -5.3 -1.2
df.columns
MultiIndex(levels=[['B2', 'B5', 'B3', .....], ['A1', 'A2' ......]],
labels=[[1, 1, ....], [1, 0, ....]],
names=[None, 'bkt'])
我正在尝试仅对列名进行排序并保持每列中的值以获得以下所需输出:
B2 B3 B5
bkt A1 A2 C1 Z2 A1 A2
Date
2019-06-11 ..
2019-06-12 ..
..
表示原始数据帧中的值。我只是没有重新输入它们。
设置
df = pd.DataFrame([
[.8, .2, -6., -.8, -4.1, -.6],
[.8, .2, -6.9, -1.6, -5.3, -1.2]
],
pd.date_range('2019-06-11', periods=2, name='Date'),
pd.MultiIndex.from_arrays([
'B2 B2 B5 B5 B3 B3'.split(),
'A1 A2 A2 A1 Z2 C1'.split()
], names=[None, 'bkt'])
)
使用 sort_index
并将其分配回去
df.columns=df.sort_index(axis=1,level=[0,1],ascending=[True,False]).columns
并且从 piR 开始,我们不需要创建 df 的副本,只需对列进行修改
df.columns=df.columns.sort_values(ascending=[True, False])
这应该使用 sort_index
移动列名和数据来完成:
df.sort_index(axis=1, level=[0, 1], ascending=[True, False], inplace=True)