首页 > 解决方案 > 将目录中的所有 excel 文件读入数据框并使用文件名添加列

问题描述

我有一个包含一些 excel 文件的文件夹。我想将它们全部读入数据框,但同时添加一个日期列。日期包含在每个文件名中。我有读取文件内容的代码,但不确定如何从文件名中读取日期。

这是我读取文件的代码。

import pandas as pd
import glob

all_data = pd.DataFrame()
for f in glob.glob('my directory/*.xlsx'):
    df = pd.read_excel(f)
    all_data = all_data.append(df,ignore_index=True)

我假设我需要添加 df['date']= 但不确定如何从文件名中获取日期。所有文件名都具有相同的格式,名称末尾带有日期。例如,“数据报告 06.08.21”。

非常感谢您的帮助。

标签: python-3.xpandasdataframe

解决方案


 import pandas as pd
 import glob, os, re

 all_data = pd.DataFrame()
 for f in glob.glob('my directory/*.xlsx'):
      _, f_file= os.path.split(f)
     file_date=re.findall(r'\d{2}\.\d{2}\.\d{2}', f_file)
     df = pd.read_excel(f)
     df['date'] =str(file_date)
     all_data = all_data.append(df,ignore_index=True)

推荐阅读