首页 > 解决方案 > 使用 imgaug 增加数据集大小

问题描述

我正在将两个包含图像的不同数据集合并到一个数据集中。其中一个数据集包含训练集中的 600 张图像。另一个数据集仅包含 90-100 张图像。我想通过使用imgaug 库来增加后一个数据集的大小。图像存储在其类名称下的文件夹中。所以训练集中“蛋糕”图像的路径是..//images//Cake//cake_0001. 我正在尝试使用此代码来扩充此数据集中的图像:

path = 'C:\\Users\\User\\Documents\\Dataset\\freiburg_groceries_dataset\\images'

ia.seed(6)

seq = iaa.Sequential([
    iaa.Fliplr(0.5),
    iaa.Crop(percent=(0, 0.1)),
    iaa.Affine(rotate=(-25,25))
], random_order=True)

for folder in os.listdir(path):
    try:
        for i in os.listdir(folder):
            img = imageio.imread(i)
            img_aug = seq(images=img)
            iaa.imshow(img_aug)
            print(img_aug)
    except:
        pass

现在没有输出,即使我放了print(img)imshow(img)任何东西。如何确保我获得了更多用于此数据集的图像?另外,增强图像的最佳位置是什么?增强图像存储在哪里,如何查看生成了多少新图像?

标签: pythonmachine-learningdata-augmentation

解决方案


这是因为folder不是您要查找的目录的路径。您应该更改for i in os.listdir(folder):for i in os.listdir(path+'\\'+folder):. 然后它在path\folder目录中查找文件。


推荐阅读