首页 > 解决方案 > 使用一个列表迭代并组合对象以使用python查找具有两个扩展名的文件

问题描述

我想将可能的扩展列表迭代到两个变量中以查找所有可能的匹配项。

使用 bash,这将部分实现,如下所示:

while read ext; do
   find $DIR -type f -name "*.$ext.*"
done < extensions.txt

while read ext; do
   find $DIR -type f -name "*.*.$ext"
done < extensions.txt

其中extensions.txt包含:

phar
php
pl
py
cgi
asp
js
html
htm
phtml
txt
gif

但我想要实现的是只组合这一个列表的扩展。例如,我想查找类似filename.php.txtorfilename.html.gif而不是任何类型的filename.random.extension文件,因为这会输出太多文件。

有人可以帮忙吗?

到目前为止我已经尝试过的说明

我将一个文件放在一个/some/www/path/html/名为filename.php.txt 我运行以下脚本的目录中

#!/usr/bin/python

from glob import glob

with open('/root/scan-files/extensions.txt', 'r') as f:
    exts = f.readlines()

for file in glob("/some/www/path/html/*.*.*"):
    if all(i in exts for i in file.split('.')[1:]):
        print(file)

并且没有输出。它应该filename.php.txt在那个路径中找到了。

尝试调试:

python -m pdb find-malicious-extensions.py 
> /root/scan-files/find-malicious-extensions.py(3)<module>()
-> from glob import glob
(Pdb) n
> /root/scan-files/find-malicious-extensions.py(5)<module>()
-> with open('/root/scan-files/extensions.txt', 'r') as f:
(Pdb) n
> /root/scan-files/find-malicious-extensions.py(6)<module>()
-> exts = f.readlines()
(Pdb) n
> /root/scan-files/find-malicious-extensions.py(8)<module>()
-> for file in glob("/some/www/path/html/*.*.*"):
(Pdb) n
> /root/scan-files/find-malicious-extensions.py(9)<module>()
-> if all(i in exts for i in file.split('.')[1:]):
(Pdb) n
> /root/scan-files/find-malicious-extensions.py(8)<module>()
-> for file in glob("/some/www/path/html/*.*.*"):
(Pdb) n
--Return--
> /root/scan-files/find-malicious-extensions.py(8)<module>()->None
-> for file in glob("/some/www/path/html/*.*.*"):
(Pdb) n
--Return--
> <string>(1)<module>()->None
(Pdb) n
The program finished and will be restarted

有什么想法会出错吗?

标签: pythonlistfile-type

解决方案


以下是如何使用模块中的glob方法glob

from glob import glob

with open('extensions.txt', 'r') as f:
    exts = f.readlines()

for file in glob("*.*.*"):
    if all(i in exts for i in file.split('.')[1:]):
        print(file)

分解它:

  1. globglob模块中导入方法:
from glob import glob
  1. 打开extensions.txt文件并将所有扩展名存储在列表中:
with open('extensions.txt', 'r') as f:
    exts = f.readlines()
  1. 遍历当前目录中名称中至少包含 2 个点的所有文件:
for file in glob("*.*.*"):
  1. 用一个点分割每个文件的名称,并检查除第一个字符串之外的所有字符串是否都在有效扩展名中。如果是这样,请打印文件名:
    if all(i in exts for i in file.split('.')[1:]):
        print(file)

推荐阅读