首页 > 解决方案 > 深度学习 - 将图像数据集拆分为训练和测试

问题描述

在此处输入图像描述我在一个文件夹中有 3000 张用于训练和测试的图像,并且我在 label.csv 文件中也有图像标签,该文件具有五个类别。谁能帮助我如何将此数据集拆分为训练和测试数据,以便我可以使用卷积神经网络对图像进行分类。与 csv 和图像链接后,我的数据集如下图所示。

标签: pythontensorflowdeep-learningcomputer-visionconv-neural-network

解决方案


首先,您需要图像和标签之间的关联(某种关于哪个标签属于哪个图像的知识)。否则将无法正常工作。之后,您可以拆分数据集。这是一个玩具示例,假设full_dataset包含整个数据集并且SIZE_OF_DATASET大小为full_dataset

full_dataset = full_dataset.shuffle()
train_dataset = full_dataset.take(int(0.8*SIZE_OF_DATASET))
test_dataset = full_dataset.skip(int(0.2*SIZE_OF_DATASET))

推荐阅读