首页 > 解决方案 > 读取子文件夹中的 Excel 文件以及如何使用子文件夹名称作为新列值?

问题描述

我有一个主文件夹,然后我在里面有不同国家的文件夹,里面有 Excel 文件。

我想知道是否有人知道我如何阅读所有这些 Excel 文件并将子文件夹/国家/地区名称用作列值。

然后我打算连接所有这些文件,因为它们都是相同的结构。

谢谢

标签: python-3.xpandasdataframe

解决方案


你可以尝试这样的事情:

import pandas as pd
import pathlib

main_folder = './data'

data = []
for xlsxfile in pathlib.Path(main_folder).glob('**/*.xlsx'):
    df = pd.read_excel(xlsxfile)
    df['dirpath'] = xlsxfile.parent
    data.append(df)

df = pd.concat(data)

推荐阅读