首页 > 解决方案 > 如何将部分 Excel 文件名存储在 Python 整数变量中

问题描述

想象一下,我有一个名称为 excel 的文件LP_Elements_Shocked_202108160517.xlsx

我想提取文件名的这个特定部分并将其存储为整数20210816

模式是一致的。所有文件都以我需要的八位数字开头,LP_Elements_Shocked_然后是。然后总会有 4 个我不需要的数字之后

这是我到目前为止所拥有的:

import pandas as pd
pd.read_excel('LP_Elements_Shocked_202108160517.xlsx')

标签: pythonpandas

解决方案


由于您的模式总是以相同的字符串开头,因此您可以只使用子字符串(对字符串进行切片):

filename = 'LP_Elements_Shocked_202108160517.xlsx'

print(filename[20:28]) # prints: '20210816'

否则,您可以将正则表达式用于更复杂的模式。

对于要在每个数据帧中保留文件名的部分(来自评论),最简单的方法是在您读取的每个数据帧中添加一个填充了文件名的列(熊猫本身不会跟踪文件名excel文件)。

请参阅此相关问答:read_excel into data frame and keep file name as column (Pandas)


推荐阅读