首页 > 解决方案 > 如何通过扩充来平衡文件夹中的图像,使该文件夹中的图像数量等于其他文件夹中的图像数量?

问题描述

我有 5 个名为class_i的文件夹,每个文件夹都有i类图像。图片为 .jpg 格式。如何通过扩充来平衡每个文件夹中的图像,以使该文件夹中的图像数量等于图像数量最多的文件夹中的图像数量?另外,您能否帮助绘制一条曲线,显示平衡前后每个文件夹中的图像数量?

标签: pythonclassificationdata-augmentationbalance

解决方案


只是用算法扩展了我的另一个答案,该算法完全符合您在这个问题中的要求。算法位于我答案的最后。

它接受两个文件夹 - 一个用于输入,一个用于输出。每个文件夹都包含以整数标签命名的子文件夹,每个子文件夹都包含该标签的图像。

当代码首先运行时,它会进行增强,然后绘制输入文件夹(未修改)的图像计数,并在窗口关闭后绘制第二个窗口,其中包含增强(输出)图像的计数。

在输出文件夹中,每个图像都以源图像名称加上后缀来命名,后缀表示用于生成输出 PNG 图像的增强方法。每个图像可以有多个增强过滤器,每个过滤器产生一个 PNG 输出。


推荐阅读