python - 合并文件夹中的数据框
问题描述
我正在尝试在 Python 中合并不同的 csv。这些文件位于同一文件夹中。所有文件都有一个共同的“client_ID”列。我试过这段代码:
path= r'/folder_path/'
allfiles = glob.glob(path + "/*.csv")
df = pd.DataFrame()
for file in allfiles:
df_file = pd.read_csv(file)
df_file = pd.merge(df, df_file, on='partner_id')
df
解决方案
您可以先读取第一个 csv 文件,以免从空数据框开始。我会像这样编辑您的代码:
path= r'/folder_path/'
allfiles = glob.glob(path + "/*.csv")
for i, file in enumerate(allfiles):
if i < 1:
df = pd.read_csv(file)
else:
df_file = pd.read_csv(file)
df = pd.merge(df, df_file, on='partner_id')
df
推荐阅读
- excel - 如何每天在excel中自动添加值
- jenkins - 尝试连接到 Jenkins Selenium Grid 插件时出现 HttpHostConnectException
- opencv - 提取深色轮廓
- php - 在没有foreach的多维数组php中按值删除
- flutter - Cloud Firestore:排列文档
- python - 在 Python 中使用 Paramiko 执行 SFTP 命令
- sparql - 三元组的 QName (MarkLogic)
- java - 如何按属性对对象列表进行分组,然后使用 (Key, Value) 对迭代结果?
- android - 外部一次性是否在rxjava中自动配置内部一次性?
- angular - Angular 5 从 Angular-cli.json 加载 CDN 脚本标签