重新组合 pandas 个多索引列
Regrouping pandas multiindex columns
我 运行 遇到一个问题,即向多索引列 DataFrame 添加新列会导致新列附加到 DataFrame 的末尾。例如:
Group 1 | Group 2 | Group 1 | Group 2 |
------------------------------------------------------
Sub 1 | Sub 2 | Sub 1 | Sub 2 | New Sub | New Sub |
而我想要的是:
Group 1 | Group 2 |
------------------------------------------------------
Sub 1 | Sub 2 | New Sub | Sub 1 | Sub 2 | New Sub |
有没有办法 re-group/order 我的多索引可以做到这一点?注意-我不想按名称重新排序子组,因为新子组需要放在最后,并且按字母顺序可能无法正确排序。
您只需在设置后调用df.sort_index :
df1=pd.DataFrame(columns=pd.MultiIndex.from_product((('a','b'),
(1,2))),data=np.arange(4).reshape(1,-1))
df2=pd.DataFrame(columns=pd.MultiIndex.from_tuples((('a','3'),('b',5))),data=[[9,9]])
df=df1.join(df2)
# a b a b
# 1 2 1 2 3 5
# 0 0 1 2 3 9 9
df.sort_index(axis=1,inplace=True)
# a b
# 1 2 3 1 2 5
# 0 0 1 9 2 3 9
我认为你需要 reindex
or reindex_axis
自定义 list
:
df1=pd.DataFrame(columns=pd.MultiIndex.from_product((('C','R', 'A'),(1,2))),
data=np.arange(6).reshape(1,-1))
df2=pd.DataFrame(columns=pd.MultiIndex.from_tuples((('C','3'),('R',5),('A',4))),
data=[[9,9,4]])
df=df1.join(df2)
print (df)
C R A C R A
1 2 1 2 1 2 3 5 4
0 0 1 2 3 4 5 9 9 4
df1 = df.reindex(columns = ['C','R','A'], level=0)
print (df1)
C R A
1 2 3 1 2 5 1 2 4
0 0 1 9 2 3 9 4 5 4
df1 = df.reindex_axis(['C','R','A'], level=0, axis=1)
print (df1)
C R A
1 2 3 1 2 5 1 2 4
0 0 1 9 2 3 9 4 5 4
我 运行 遇到一个问题,即向多索引列 DataFrame 添加新列会导致新列附加到 DataFrame 的末尾。例如:
Group 1 | Group 2 | Group 1 | Group 2 |
------------------------------------------------------
Sub 1 | Sub 2 | Sub 1 | Sub 2 | New Sub | New Sub |
而我想要的是:
Group 1 | Group 2 |
------------------------------------------------------
Sub 1 | Sub 2 | New Sub | Sub 1 | Sub 2 | New Sub |
有没有办法 re-group/order 我的多索引可以做到这一点?注意-我不想按名称重新排序子组,因为新子组需要放在最后,并且按字母顺序可能无法正确排序。
您只需在设置后调用df.sort_index :
df1=pd.DataFrame(columns=pd.MultiIndex.from_product((('a','b'),
(1,2))),data=np.arange(4).reshape(1,-1))
df2=pd.DataFrame(columns=pd.MultiIndex.from_tuples((('a','3'),('b',5))),data=[[9,9]])
df=df1.join(df2)
# a b a b
# 1 2 1 2 3 5
# 0 0 1 2 3 9 9
df.sort_index(axis=1,inplace=True)
# a b
# 1 2 3 1 2 5
# 0 0 1 9 2 3 9
我认为你需要 reindex
or reindex_axis
自定义 list
:
df1=pd.DataFrame(columns=pd.MultiIndex.from_product((('C','R', 'A'),(1,2))),
data=np.arange(6).reshape(1,-1))
df2=pd.DataFrame(columns=pd.MultiIndex.from_tuples((('C','3'),('R',5),('A',4))),
data=[[9,9,4]])
df=df1.join(df2)
print (df)
C R A C R A
1 2 1 2 1 2 3 5 4
0 0 1 2 3 4 5 9 9 4
df1 = df.reindex(columns = ['C','R','A'], level=0)
print (df1)
C R A
1 2 3 1 2 5 1 2 4
0 0 1 9 2 3 9 4 5 4
df1 = df.reindex_axis(['C','R','A'], level=0, axis=1)
print (df1)
C R A
1 2 3 1 2 5 1 2 4
0 0 1 9 2 3 9 4 5 4