首页 > 解决方案 > 熊猫。复制多索引级别

问题描述

我有一个带有多索引列的 DataFrame:

df = pd.DataFrame(np.arange(12).reshape(3,-1))
df.columns = [['A', 'A', 'B', 'B'], [0, 1, 0, 1]]
print(df)

看起来像这样:

   A      B    
   0  1   0   1
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11

我想做一些类似df['C'] = df['B']的事情:

    A       B       C    
    0   1   0   1   0   1
0   0   1   2   3   2   3
1   6   7   8   9   8   9
2  12  13  14  15  14  15

我得到ValueError: Wrong number of items passed 2, placement implies 1.

我也试过df.loc[:, slice('C', None)] = df['B']没有运气。

实际上我的情况有点复杂:我在多索引(L0 I)中多了一层,我想复制df['L0 I', 'B']df['L0 II', 'B']L0 II不存在)。

标签: pythonpandasdataframemulti-index

解决方案


您可以提取列并MultiIndex在列中创建:

df1 = df['B']
df1.columns = [['C'] * len(df1.columns), df1.columns]
print (df1)
    C    
    0   1
0   2   3
1   6   7
2  10  11

或按切片和rename第一级选择:

df1 = df.loc[:, slice('B', None)].rename(columns={'B':'C'}, level=0)
print (df1)
    C    
    0   1
0   2   3
1   6   7
2  10  11

然后joinconcat一起:

df = df.join(df1)
#alternative
#df = pd.concat([df,df1], axis=1)
print (df)
   A      B       C    
   0  1   0   1   0   1
0  0  1   2   3   2   3
1  4  5   6   7   6   7
2  8  9  10  11  10  11

在这里工作的另一个解决方案是使用DataFrame.stack,复制列DataFrame.assign并重新整形DataFrame.unstack

df1 = df.stack().assign(C = lambda x: x['B']).unstack()
print (df1)
   A      B       C    
   0  1   0   1   0   1
0  0  1   2   3   2   3
1  4  5   6   7   6   7
2  8  9  10  11  10  11

推荐阅读