python-3.x - 读取子文件夹中的 Excel 文件以及如何使用子文件夹名称作为新列值?
问题描述
我有一个主文件夹,然后我在里面有不同国家的文件夹,里面有 Excel 文件。
我想知道是否有人知道我如何阅读所有这些 Excel 文件并将子文件夹/国家/地区名称用作列值。
然后我打算连接所有这些文件,因为它们都是相同的结构。
谢谢
解决方案
你可以尝试这样的事情:
import pandas as pd
import pathlib
main_folder = './data'
data = []
for xlsxfile in pathlib.Path(main_folder).glob('**/*.xlsx'):
df = pd.read_excel(xlsxfile)
df['dirpath'] = xlsxfile.parent
data.append(df)
df = pd.concat(data)
推荐阅读
- c++ - 在 C++ 中,如何将参数添加到“Args&&... args”参数列表?
- audio - 如何将 5.1 .flac 音轨添加到已经有 3 个音轨的 .ts 文件中?
- git - 如何在带有 Git 存储库的 TFS 中查看用户的签入历史记录
- git - Git - 是否可以添加标签并将其作为提交?就像在 Mercurial 中一样
- bash - 使用 bash 从 Txt 文件设置用户名和密码
- java - 运行 URI 时从 rest 服务获取重复值输出
- python - 试图以恒定速率从列表列表中减去
- r - 为每个组运行一个函数
- php - 使用查询生成器、InnerJoin 和别名进行搜索/过滤
- xamarin.forms - ListView 设置高度以显示所有项目而不滚动