python-3.x - 将目录中的所有 excel 文件读入数据框并使用文件名添加列
问题描述
我有一个包含一些 excel 文件的文件夹。我想将它们全部读入数据框,但同时添加一个日期列。日期包含在每个文件名中。我有读取文件内容的代码,但不确定如何从文件名中读取日期。
这是我读取文件的代码。
import pandas as pd
import glob
all_data = pd.DataFrame()
for f in glob.glob('my directory/*.xlsx'):
df = pd.read_excel(f)
all_data = all_data.append(df,ignore_index=True)
我假设我需要添加 df['date']= 但不确定如何从文件名中获取日期。所有文件名都具有相同的格式,名称末尾带有日期。例如,“数据报告 06.08.21”。
非常感谢您的帮助。
解决方案
import pandas as pd
import glob, os, re
all_data = pd.DataFrame()
for f in glob.glob('my directory/*.xlsx'):
_, f_file= os.path.split(f)
file_date=re.findall(r'\d{2}\.\d{2}\.\d{2}', f_file)
df = pd.read_excel(f)
df['date'] =str(file_date)
all_data = all_data.append(df,ignore_index=True)
推荐阅读
- windows - NTAccount.Translate 失败后出现异常“System.ObjectDisposedException:安全句柄已关闭”
- php - 如何在 PHP 中为电子邮件收件人制作有效的循环脚本(使用 PHPMailer)
- ios - 在 UITableView 上滚动时 UIActivityIndicatorView 消失
- java - Spring批处理NoClassDefFoundError:oracle/xdb/XMLType
- gitlab-ci - 在带有巧克力的 Windows 上安装 gitlab-runner
- python - 在firestore中设置python http函数
- css - 如何在 html 和 css 中制作始终位于底部的项目
- node.js - HTML 5 音频元素是否在除 Firefox 之外的所有浏览器中都损坏了?
- python - 当鼠标悬停在 QGraphicsProxyWidget 上时,QGraphicsView 的行为不同
- javascript - 错误:预期的模拟函数已被调用 - onclick Jest 酶