python - 深度学习 - 将图像数据集拆分为训练和测试
问题描述
在此处输入图像描述我在一个文件夹中有 3000 张用于训练和测试的图像,并且我在 label.csv 文件中也有图像标签,该文件具有五个类别。谁能帮助我如何将此数据集拆分为训练和测试数据,以便我可以使用卷积神经网络对图像进行分类。与 csv 和图像链接后,我的数据集如下图所示。
解决方案
首先,您需要图像和标签之间的关联(某种关于哪个标签属于哪个图像的知识)。否则将无法正常工作。之后,您可以拆分数据集。这是一个玩具示例,假设full_dataset
包含整个数据集并且SIZE_OF_DATASET
大小为full_dataset
:
full_dataset = full_dataset.shuffle()
train_dataset = full_dataset.take(int(0.8*SIZE_OF_DATASET))
test_dataset = full_dataset.skip(int(0.2*SIZE_OF_DATASET))
推荐阅读
- c# - 影响单行的 Wpf 多行文本框样式
- c# - 在 c# 之后在 HTML 中添加 div
- java - 自定义卡片视图适配器:通知数据集更改不起作用
- reactjs - ELI5 React Hooks 如何知道何时更新 DOM?
- javascript - 选择 SlickGrid 的第一行
- .net - Ruby - 无法打开 STDIN 管道到 .NET 应用程序
- apache-kafka - 卡夫卡到雪花连接问题
- terraform - 在资源级别使用 for / for_each 迭代嵌套数据
- arrays - Class-validator - 验证对象数组
- python - 使用 Xception CNN 训练自定义图像时出现奇怪的错误