首页 > 解决方案 > 使用多索引连接多个 .csv 数据帧

问题描述

我连接多个dfs看起来像这样的:

                 X                  Y
                 mean   std size   mean         std  size
In_X                    
(10.424, 10.43] 10.425  NaN  1      0.003786    NaN   1
(10.43, 10.435] 10.4    NaN  0      NaN         NaN   0

当我没有 multiindexdfs时,我正在使用:

extension='csv'
all_filenames = [i for i in glob.glob('*.{}'.format(extension))]
all_dfs = pd.concat([pd.read_csv(f) for f in all_filenames ])

但这引入了一行:

mean   std size   mean          std  size

每次新df连接到all_dfs. 如何只有原始的多索引标头并避免在连接的df中引入二级标头?

标签: pythonpandas

解决方案


read_csv默认情况下,仅将第一行作为标题。您想要指定两行标题header

all_dfs = pd.concat([pd.read_csv(f, header=[0,1] for f in all_filenames ])

推荐阅读