首页 > 解决方案 > 如何导入自己的数据集来训练 GAN

问题描述

在 GAN 的应用中,我们看到很多人使用 MNIST 和 Cifar10 数据集,因为这些数据集分为训练数据和测试数据。

在此处输入图像描述

虽然我们的大多数情况是我们可能需要使用我们的数据。就像我的数据集的训练路径是:'/content/drive/MyDrive/Colab Notebooks/original data/positive' 那么我该如何导入它们,我应该将我的数据拆分为训练集还是测试集?我所有的数据集都是笑脸,我想通过 GAN 生成更多的笑脸。

有什么想法或github项目可以分享吗?

标签: pythongenerative-adversarial-network

解决方案


需要注意的一点是,GAN 不是 CNN 或 RNN,它没有任何分类任务(我指的是普通 GAN)。它包含一个鉴别器和一个生成器,这意味着D将使用从G合成的图像,并将其与训练集中的原始图像一起作为输入。通过这种方式,G被训练来合成更真实的图像。

因此,您不需要将数据集分成训练/测试集——在这种情况下不适用于 GAN。

要导入您自己的数据而不是使用库中已有的数据,flow_from_directory()如果您使用的是 keras/tensorflow,我建议您使用。

你可以参考这里的文档。

编辑:或直接load_img(directory)用于单个图像。文档与上述相同。


推荐阅读