python - python for循环中的性能优化
问题描述
我正在使用我的自定义数据集实现一个 CNN,其中包含超过 10 万张图像。这些是图像,命名为{code}-{uuid}.png
,其中{codes}
图像的不同标签{uuid}
是唯一的文件标识符。
现在,我编写了一个函数来读取这些图像,从性能的角度来看,这是非常不理想的。减慢函数速度的核心是我用来读取图像、从文件名解析代码并保存两个数组的双 for 循环,一个用于图像,一个用于相应的标签:
for code in codes:
for file in glob.glob(f'features/image_dataset/{code}*.png'):
labels.append(re.findall(f'{code}', file))
tmp_ary = np.expand_dims(plt.imread(file), axis=0)
ary = np.append(ary, tmp_ary, axis=0)
如何提高循环的性能?
解决方案
推荐阅读
- javascript - 我正在尝试在部分代码之间设置超时,但语法忽略了暂停
- r - geom_bar():从总观测值中绘制子组的频率
- linux - 我们如何防止 CTRL-C 终止屏幕?
- laravel - Bootstrap Installed and working fine but custom styling doesn't works
- c - What should be the right usage of strncpy_s() - secure string copy - to handle all the possible corner cases?
- dialogflow-es - How can I handle non-text messages with Dialogflow?
- numpy - 在numpy中选择具有可变索引范围的数组元素
- c# - Angular Synchronous operations in API
- debugging - 哪些内容/因素会增加 C++ 程序 exe 文件的大小?
- flutter - 如何将容器高度扩展到最大?