首页 > 解决方案 > 为机器学习模型创建标记图像数据集

问题描述

我的问题是关于如何创建用于机器学习的标记图像数据集?

我一直在使用已经可用的数据集,所以我在如何标记图像数据集方面面临困难(就像我们在猫与狗分类中所做的那样)。

我必须做标记以及图像分割,在互联网上搜索后,我发现了一些手动标记工具,如LabelMeLabelBox .LabelMe 很好,但它以 XML 文件的形式返回输出。

现在我再次关心的是如何将 XML 文件输入神经网络?我不擅长图像处理任务,所以我需要一个替代建议。

编辑:我已经扫描了学位证书和普通文件的副本,我必须制作一个分类器,将学位证书分类为 1,将非学位证书分类为 0。所以我的标签就像:
Degree_certificate -> y(1)
Non_degree_cert - > y(0)

标签: pythonmachine-learning

解决方案


您不会将 XML 文件提供给神经网络。您使用 XML 解析器处理它们,并使用它来提取标签。请参阅问题如何在 Python 中解析 XML?有关如何工作的建议。

图像数据集可以有多种起始状态。例如,有时图像位于代表其类别的文件夹中。如果您喜欢使用这种方法,那么不要在每次训练时都直接读取 XML 文件,而是使用它以您喜欢或习惯的形式创建数据集。您在网上找到许多很好的现成数据集的原因是因为其他人正是这样做的。这是值得的,因为您不需要重复所有原始数据的转换来开始训练模型。

例如,从 LabelMe 收集您的 XML 数据,然后使用一个简短的脚本来读取 XML 文件,提取您之前使用 ElementTree 输入的标签,并将图像复制到正确的文件夹中。您最终将获得一个数据集,该数据集包含两个文件夹,其中包含正负匹配图像,可以使用您最喜欢的 CNN 图像处理包进行处理。


推荐阅读