dataframe - 加载多个 xls 文件、编辑和附加到一个数据帧中
问题描述
我对 python 有点陌生,我很好奇加载多个 xls 文件的最佳方法,对列名进行一些编辑,然后创建一个大型数据框,然后我可以对其进行一些统计分析。我无法加载文件并立即追加(我找到了很多关于如何做到这一点的示例),因为我需要编辑列名。我根据在 stackoverflow 上找到的信息尝试了一些事情。最简单的是(我的stackoverflow编辑器有点奇怪,所以我逐行发布代码):
files = os.listdir(path)
files_xls = [f for f in files if f[-3:] == 'xls']
for f in files_xls:
vars()[f[:-4]] = pd.DataFrame()
vars()[f[:-4]] = pd.read_excel(f, 'Sheet1')
这加载了 7 个 xls 文件并为每个文件创建了一个数据框。 我如何遍历它们以附加到单个数据帧中?
我尝试过的另一种方法是使用以下命令将 xls 文件加载到字典中:
d= {name: pd.read_excel(name, 'Sheet1') for name in files_xls}
这看起来很漂亮,但我无法剥离 .xls 扩展名。 基本上我想将上述语句与类似于以下语句的内容结合起来,但无法正确引用:
d = {name: pd.DataFrame() for name in [x[:-4] for x in files_xls]}
但是,无论扩展如何,我都不知道如何引用该字典中的数据框。 我将如何在字典中的数据帧上使用数据帧compare
或命令?rename
最后,如何将字典中的数据帧附加到一个数据帧中?
解决方案
推荐阅读
- java - 在两个构造函数中初始化最终变量
- node.js - 错误:5 NOT_FOUND:在 LongRunningRecognize 上找不到请求的实体
- c# - Linq-to-SQL 中的多个 JOIN
- parameters - youtube-iframe-api 嵌入参数不再起作用
- php - 将字符串转换/转换为 PHP 关联数组
- python-3.x - Bokeh ValueError:期望 Seq(String) 的元素
- php - 使用 html 表单将数据插入到 wordpress 表中
- r - 用于创建具有较小值的矩阵的 R 代码
- python - 使用 bakeshare 数据的假人 Python
- sql - Jet/ACE SQL,iif 语句,同一列的 2 个假值