python - 如何导入自己的数据集来训练 GAN
问题描述
在 GAN 的应用中,我们看到很多人使用 MNIST 和 Cifar10 数据集,因为这些数据集分为训练数据和测试数据。
虽然我们的大多数情况是我们可能需要使用我们的数据。就像我的数据集的训练路径是:'/content/drive/MyDrive/Colab Notebooks/original data/positive' 那么我该如何导入它们,我应该将我的数据拆分为训练集还是测试集?我所有的数据集都是笑脸,我想通过 GAN 生成更多的笑脸。
有什么想法或github项目可以分享吗?
解决方案
需要注意的一点是,GAN 不是 CNN 或 RNN,它没有任何分类任务(我指的是普通 GAN)。它包含一个鉴别器和一个生成器,这意味着D将使用从G合成的图像,并将其与训练集中的原始图像一起作为输入。通过这种方式,G被训练来合成更真实的图像。
因此,您不需要将数据集分成训练/测试集——在这种情况下不适用于 GAN。
要导入您自己的数据而不是使用库中已有的数据,flow_from_directory()
如果您使用的是 keras/tensorflow,我建议您使用。
你可以参考这里的文档。
编辑:或直接load_img(directory)
用于单个图像。文档与上述相同。
推荐阅读
- sql - 为什么它总是给我同样的错误?
- javascript - 如何在使用 jQuery 粘贴期间阻止输入字段中的 TAB `\t` 或其他特殊字符?
- java - XPages 运行时错误:java.lang.AbstractMethodError: lotus/domino/RichTextItem.convertToHTML(Ljava/util/Vector;)Ljava/lang/String;
- c# - 将自定义列表序列化为json c#
- c# - Usercontrol - 从 ViewModel 通知属性更改
- firebase - 从实时firebase android studio中检索产品列表
- c++ - UE4,设置物体的相对角速度
- rust - 如何将 Aeron 驱动程序 JAR 嵌入 Rust 程序并稍后启动它?
- ruby-on-rails - [rails]:在数据库上实现多个索引
- google-kubernetes-engine - GKE 私有集群仍有公共端点?