首页 > 解决方案 > 加载多个 xls 文件、编辑和附加到一个数据帧中

问题描述

我对 python 有点陌生,我很好奇加载多个 xls 文件的最佳方法,对列名进行一些编辑,然后创建一个大型数据框,然后我可以对其进行一些统计分析。我无法加载文件并立即追加(我找到了很多关于如何做到这一点的示例),因为我需要编辑列名。我根据在 stackoverflow 上找到的信息尝试了一些事情。最简单的是(我的stackoverflow编辑器有点奇怪,所以我逐行发布代码):

files = os.listdir(path)

files_xls = [f for f in files if f[-3:] == 'xls']

for f in files_xls:

vars()[f[:-4]] = pd.DataFrame()

vars()[f[:-4]] = pd.read_excel(f, 'Sheet1')

这加载了 7 个 xls 文件并为每个文件创建了一个数据框。 我如何遍历它们以附加到单个数据帧中?

我尝试过的另一种方法是使用以下命令将 xls 文件加载到字典中:

d= {name: pd.read_excel(name, 'Sheet1') for name in files_xls}

这看起来很漂亮,但我无法剥离 .xls 扩展名。 基本上我想将上述语句与类似于以下语句的内容结合起来,但无法正确引用:

d = {name: pd.DataFrame() for name in [x[:-4] for x in files_xls]}

但是,无论扩展如何,我都不知道如何引用该字典中的数据框。 我将如何在字典中的数据帧上使用数据帧compare或命令?rename最后,如何将字典中的数据帧附加到一个数据帧中?

标签: dataframedictionaryappendconcatenationxls

解决方案


推荐阅读