首页 > 解决方案 > 通过循环从目录中提取文件

问题描述

我正在运行一个需要访问目录中大约 200 个文件的循环。

在文件夹中 - 文件的格式范围如下:

Excel_YYYYMMDD.txt
Excel_YYYYMMDD_V2.txt
Excel_YYYYMMDD_orig.txt

我只需要提取第一个 - 即 YYYYMMDD.txt,仅此而已

我正在使用 glob.glob 访问我指定路径名的目录,如下所示:

path = "Z:\T\Al8787\Box\EAST\OT\\ABB files/2019/*[0-9].txt"

但是代码也提取了 .Excel_YYYYMMDD_orig.txt 文件

感谢有关如何修改代码以仅提取所需文件的帮助。

标签: python

解决方案


一个简单的解决方案是遍历glob.glob(path). 例如,如果

files = glob.glob("Z:\T\Al8787\Box\EAST\OT\\ABB files/2019/*[0-9].txt")

你可以有

cleaned_files = [file for file in files if "orig" not in files]

这将删除文件中包含子字符串的每个项目orig


推荐阅读