首页 > 解决方案 > Pandas Dataframe,如何在 Python 中将列组合在一起

问题描述

我有一个熊猫数据框,我想对一些列进行分组以构建更高级别的列:

例子:我有

Index       A       B       C       D
    1    0.25     0.3    0.25    0.66
    2    0.25     0.3    0.25    0.66
    3    0.25     0.3    0.25    0.66

而且我要

    Index              AB        ||           CD
    Subindex       A   |      B  ||      C    |      D 
    1            0.25  |    0.3  ||   0.25    |    0.66
    2            0.25  |    0.3  ||   0.25    |    0.66
    3            0.25  |    0.3  ||   0.25    |    0.66

谢谢您的帮助...

标签: pythonpandasdataframegroup-by

解决方案


创建一个字典来定义您的映射并使用pd.MultiIndex.from_tuples. 如果需要,您还可以指定 names=['level_0', 'level_1']添加名称。

import pandas as pd

d = {'A': 'AB', 'B': 'AB', 'C': 'CD', 'D': 'CD'}
df.columns = pd.MultiIndex.from_tuples([*zip(map(d.get, df), df)])
# Equivalently
# df.columns = pd.MultiIndex.from_tuples([(d[col], col) for col in df.columns])

输出:

         AB         CD      
          A    B     C     D
Index                       
1      0.25  0.3  0.25  0.66
2      0.25  0.3  0.25  0.66
3      0.25  0.3  0.25  0.66

推荐阅读