首页 > 解决方案 > 合并文件夹中的数据框

问题描述

我正在尝试在 Python 中合并不同的 csv。这些文件位于同一文件夹中。所有文件都有一个共同的“client_ID”列。我试过这段代码:

path= r'/folder_path/'
allfiles = glob.glob(path + "/*.csv")
df = pd.DataFrame()

for file in allfiles:
    df_file = pd.read_csv(file)
    df_file = pd.merge(df, df_file, on='partner_id')
     
df

标签: pythonpandasdataframemerge

解决方案


您可以先读取第一个 csv 文件,以免从空数据框开始。我会像这样编辑您的代码:

path= r'/folder_path/'
allfiles = glob.glob(path + "/*.csv")

for i, file in enumerate(allfiles):
    if i < 1:
        df = pd.read_csv(file)
    else:
        df_file = pd.read_csv(file)
        df = pd.merge(df, df_file, on='partner_id')
 
df

推荐阅读