首页 > 解决方案 > 解析连接文件的起点

问题描述

我在 3 个不同的文件夹中有 3 个 csv 文件,我需要合并它们,然后对每一行的值进行平均(每个文件中大约有 4000 行。

我设法将熊猫数据框与所需的 glob 和访问文件结合起来。但是,当我连接文件时,顺序与我想要的不同。

在此处输入图像描述

path = '/home/alispahic/1.CB1_project/12.Production_Runs/'
all_files = glob.glob(path + '*/3.IVa*/rmsf.csv')

li = []

for filename in all_files:
    data = pd.read_csv(filename, index_col=None, header=0)
    data['Atom']=data['Atom'].astype(int)
    data['(nm)']=data['(nm)'].astype(float)

    df1=data['Atom']
    df2=data['(nm)']


    li.append(df2)

frame = pd.concat(li, axis=0, ignore_index=True)

我想要做的是有一个输出,其中这些文件的值的顺序不会只是合并到一列中,而是有 3 列 4000 行并访问这样的值。

标签: pythonarrayspandasconcatglob

解决方案


您需要沿列轴连接以获得 3 列:

frame = pd.concat(li, axis=1, ignore_index=True)

推荐阅读