首页 > 解决方案 > python for循环中的性能优化

问题描述

我正在使用我的自定义数据集实现一个 CNN,其中包含超过 10 万张图像。这些是图像,命名为{code}-{uuid}.png,其中{codes}图像的不同标签{uuid}是唯一的文件标识符。

现在,我编写了一个函数来读取这些图像,从性能的角度来看,这是非常不理想的。减慢函数速度的核心是我用来读取图像、从文件名解析代码并保存两个数组的双 for 循环,一个用于图像,一个用于相应的标签:

    for code in codes:
        for file in glob.glob(f'features/image_dataset/{code}*.png'):
            labels.append(re.findall(f'{code}', file))
            tmp_ary = np.expand_dims(plt.imread(file), axis=0)
            ary = np.append(ary, tmp_ary, axis=0)

如何提高循环的性能?

标签: pythonoptimizationconv-neural-network

解决方案


推荐阅读