首页 > 解决方案 > 将视觉上不同的对象分类为一类

问题描述

我们正在构建一个神经网络来对对象进行分类,并拥有一个包含 1000 个类别的大型图像数据集。其中一类是“香蕉”,它包含 1000 张香蕉的图像。其中一些图像(约 10%)是香蕉泥,它们在视觉上与该类别中的其他图像非常不同。

如果我们想要对捣碎的香蕉和普通香蕉进行分类,我们应该将香蕉图像分成两个单独的类并单独训练,还是保持两个子集合并?

我试图了解视觉上不同的子类的存在如何影响给定类的识别。

标签: machine-learningclassification

解决方案


这里的问题很简单。你需要你的神经网络来学习两组图像。这意味着您需要反向传播合理的错误信息。如果你确实有关于捣碎的香蕉的真实信息,那么反向传播绝对有用。它帮助第一层学习两组特征。

请注意,神经网络的好处是您可以反向传播任何类型的误差向量。如果您的输出有 3 个节点banana, non-mashed banana, mashed banana,那么您基本上回避了问题中隐含的二元选择。在推理过程中,您始终可以删除输出节点。


推荐阅读