首页 > 解决方案 > 图像预处理 - 为 CNN 创建数据集

问题描述

我是 CNN 的新手,我需要构建一个管道来加载图像并让它们为 CNN 做好准备。问题是我需要构建一个由图像形成的数据集。图像分为三类:COVID-19、健康肺和肺炎。我拥有的文件是:

我一直在互联网上搜索,但我没有找到一种方法来构建由所有图像组成的数据集,甚至没有找到如何将它们与 .txt 文件相关联并构建相关的训练、测试和验证数据集。有什么建议吗?请在下面找到 .txt 文件的结构作为示例:

2   PNEUMONIA/person888_bacteria_2812.jpeg
2   PNEUMONIA/person1209_bacteria_3161.jpeg
2   PNEUMONIA/person1718_bacteria_4540.jpeg
2   PNEUMONIA/person549_bacteria_2303.jpeg
2   PNEUMONIA/person831_bacteria_2742.jpeg
2   PNEUMONIA/person1571_bacteria_4108.jpeg
2   PNEUMONIA/person1310_bacteria_3300.jpeg

标签: pythontensorflowkerasdeep-learningconv-neural-network

解决方案


是否有必要按照 txt 文件制作训练集和验证集?

如果没有,你可以

建立一个 train/ 目录 建立一个 train/covid 目录 建立一个 train/healthy 目录 建立一个 train/pneumonia 目录

将所有内容放在各自的目录中,然后将其中记录的总图像的一小部分随机移动到它们的验证目录中

否则,您应该阅读每个 txt 并选择特定文件并将其移动到目标文件夹。


推荐阅读