python-3.x - 查找列表项是否在文件名中
问题描述
假设我有一个像这样的文件名:D_Passaic_F01_NBR_E0003.tif
那是在我使用 Python 迭代的文件夹中。假设我想获取 E0001 和 E0010 之间的所有文件。我可能会列出一个类似的列表:select_libr = ['E0001', 'E0002', 'E0003', 'E0003', 'E0005', 'E0006', 'E0007', 'E0008', 'E0009', 'E0010']
. 使用此列表,我如何检查文件名将遍历目录以提取那些关键文件?
for filename in os.listdir(directory):
if (filename.startswith("D_")) and (filename.endswith(".tif") or filename.endswith(".tiff")):
print(os.path.join(directory, filename))
else:
continue
我想做的是:...and (item in select_libr in filename)
但我不确定这里的语法是否正确。有什么建议么?
解决方案
您可以使用正则表达式从中提取数字Exxx
,然后用它做您想做的事情。例如,
E(\d+)\.tiff?$
将匹配E
,然后是一个或多个数字,然后是 ,然后是字符串末尾的.tif
可选值。f
更重要的是,它将数字捕获为一个组,并允许我们仅将数字从匹配对象中提取出来。试试看
for filename in os.listdir(directory):
research = re.search(r"E(\d+)\.tiff?", filename)
if research: # If there was a match
fnum = research.group(1) # This is the string "0003", for example
# Then do whatever you want with it
if 0 <= int(fnum) <= 10:
print(filename)
如果您想允许任意值,我强烈建议使用 aset
而不是 alist
来存储这些值,因为检查集合中的成员资格比列表中便宜。
select_libr = {'E0001', 'E0002', 'E0003', 'E0003', 'E0005', 'E0006', 'E0007', 'E0008', 'E0009', 'E0010'}
并更改正则表达式以便E
也被捕获:(E\d+)\.tiff?
试试看
for filename in os.listdir(directory):
research = re.search(r"(E\d+)\.tiff?", filename)
if research: # If there was a match
fnum = research.group(1) # This is the string "E0003", for example
# Then do whatever you want with it
if fnum in select_libr:
print(filename)
为确保您的文件名以 开头D_
,您可以^D_.*?
添加到其他正则表达式。这D_
会在字符串的开头查找 a,后跟任意字符。其他一切都可以保持不变。试试看
推荐阅读
- php - 安装 laravel medialibrary 8.1 时出错
- java - 如何创建骆驼 webcocket 客户端?推荐一些参考例子
- java - Java中Spring-Boot微服务的计算监控指标
- mapbox - 具有自动和音高的 Mapbox 静态图像
- python - 从python中的dict列表中删除重复项
- apache-kafka - KTable suppress(Suppressed.untilTimeLimit()) 不包含指定时间的记录
- java - 如何在 bukkit/插件编程中修复此错误:java:cannot find symbol constructor CommandExecute()
- python - 如何在 python 中加载大型 xml 数据集文件?
- react-native - 在另一个文件中获取函数结果
- reactjs - 获取成功返回一个承诺