首页 > 解决方案 > 查找列表项是否在文件名中

问题描述

假设我有一个像这样的文件名:D_Passaic_F01_NBR_E0003.tif那是在我使用 Python 迭代的文件夹中。假设我想获取 E0001 和 E0010 之间的所有文件。我可能会列出一个类似的列表:select_libr = ['E0001', 'E0002', 'E0003', 'E0003', 'E0005', 'E0006', 'E0007', 'E0008', 'E0009', 'E0010']. 使用此列表,我如何检查文件名将遍历目录以提取那些关键文件?

for filename in os.listdir(directory):
    if (filename.startswith("D_")) and (filename.endswith(".tif") or filename.endswith(".tiff")):
        print(os.path.join(directory, filename))
    else:
        continue

我想做的是:...and (item in select_libr in filename)但我不确定这里的语法是否正确。有什么建议么?

标签: python-3.xloopssubstring

解决方案


您可以使用正则表达式从中提取数字Exxx,然后用它做您想做的事情。例如,

E(\d+)\.tiff?$将匹配E,然后是一个或多个数字,然后是 ,然后是字符串末尾的.tif可选值。f更重要的是,它将数字捕获为一个组,并允许我们仅将数字从匹配对象中提取出来。试试看

for filename in os.listdir(directory):
    research = re.search(r"E(\d+)\.tiff?", filename)
    if research: # If there was a match
        fnum = research.group(1) # This is the string "0003", for example
        # Then do whatever you want with it
        if 0 <= int(fnum) <= 10:
            print(filename)

如果您想允许任意值,我强烈建议使用 aset而不是 alist来存储这些值,因为检查集合中的成员资格比列表中便宜。

select_libr = {'E0001', 'E0002', 'E0003', 'E0003', 'E0005', 'E0006', 'E0007', 'E0008', 'E0009', 'E0010'}

并更改正则表达式以便E也被捕获:(E\d+)\.tiff? 试试看

for filename in os.listdir(directory):
    research = re.search(r"(E\d+)\.tiff?", filename)
    if research: # If there was a match
        fnum = research.group(1) # This is the string "E0003", for example
        # Then do whatever you want with it
        if fnum in select_libr:
            print(filename)

为确保您的文件名以 开头D_,您可以^D_.*?添加到其他正则表达式。这D_会在字符串的开头查找 a,后跟任意字符。其他一切都可以保持不变。试试看


推荐阅读