首页 > 解决方案 > 在 CNN 中使用 MIT 室内场景数据库

问题描述

我是一名工科学生,对编程有点菜鸟。我正在学习人工智能课程,目前正在尝试完成我的期末项目。

我必须创建一个 CNN 网络,我必须使用 de MIT 室内场景数据库(可以在这里找到:http ://web.mit.edu/torralba/www/indoor.html )。我在做 CNN 时没有问题,因为我在本学期之前使用 CIFAR10 做过一些,但是我在这个方面遇到了问题,因为我不知道谁使用这组图像。
我想我需要创建自己的数据集,我已经尝试使用 PyTorch 使用https://pytorch.org/tutorials/beginner/data_loading_tutorial.html,但我很困惑,因为我没有具有功能的 .csv ,我有很多 .xml 文件,每张图片都有几个功能。另外,我没有在其他教程中看到的只写“卧室、酒吧等”的文件。

我宁愿使用 PyTorch,因为我可以使用“train_test_split”函数,但如果有人能帮助我理解如何将这些 15620 输入到网络上,我将非常感激。

标签: machine-learningartificial-intelligenceconv-neural-networkpytorch

解决方案


您可以生成自己的 csv 文件,但您可能不需要它。pytorch 网站https://pytorch.org/tutorials/beginner/transfer_learning_tutorial.html#load-data上有一个很好的教程,它与您的案例非常相似或很容易适用。

麻省理工学院室内数据集每个类都有一个文件夹的图像,网站上提到的 txt 文件是训练/测试拆分。

因此,如果您创建以下文件夹结构:

train
|- class 1
|- class 2
...
|- class n

对于 val / test 也是如此,在您的案例中使用(调整) datasets.ImageFolder 示例应该是直截了当的。


推荐阅读