首页 > 解决方案 > 获取python中带有子目录的目录中的所有文件md5哈希

问题描述

我是 python 新手。我想问一下,如何在带有子目录的目录中获取所有文件 md5 哈希?目前我的编码只能获取文件夹中文件的 md5 哈希值。任何建议或代码需要进行更改?下面是我的编码:

import hashlib
import glob
import os.path
filenames = glob.glob('C:/Users/User/Desktop/irustesting/*')
def md5(fname):
    hash_md5 = hashlib.md5()
    with open(fname, "rb") as f:
        for chunk in iter(lambda: f.read(2 ** 20), b""):
            hash_md5.update(chunk)
    return hash_md5.hexdigest()

viruslist = open('C:/FYP/SecuCOM2022/viruslist.txt','rt')
virusinside = [l.rstrip() for l in viruslist]
virus="detected"
novirus="clear"

for filename in filenames:
    print(filename, md5(filename))
    if md5(filename) in virusinside:
        print(virus)
        os.remove(filename)
    else:
        print(novirus)  

标签: pythonhashdirectorymd5

解决方案


os.walk()您可以通过定义以下函数使用该方法检索文件的所有绝对路径:

import os

def get_all_abs_paths(rootdir):
   paths = list()
   for dirpath,_,filenames in os.walk(rootdir):
      for f in filenames:
         paths.append(os.path.abspath(os.path.join(dirpath, f)))
return paths

通过这种方式,您可以通过替换 glob 调用来使用您的代码来分配filenames变量filenames=get_abs_paths('C:/Users/User/Desktop/irustesting')


推荐阅读