首页 > 解决方案 > 固定对象左、中、右部分之间的图像分类任务

问题描述

我正在尝试训练一个学习模型来识别图像中表示已知对象的哪个部分(左/中/右),假设模型的输入可以是以下之一:对象左侧部分的图像(整个左侧部分或左侧部分的较小部分);其中心部分的图像(整个中心部分或中心部分的一些较小部分);其右侧部分的图像(整个右侧部分或右侧部分的较小部分)。对象的位置始终是固定的,因此所有图像都在对象前面拍摄,这也是要求模型进行预测的情况。我已经收集了数千张属于对象左侧、中间和右侧部分的图像;对于每个部分,如解释的那样,

任何建议都非常感谢。谢谢

标签: machine-learningdeep-learningconv-neural-networkimage-recognition

解决方案


由于您试图区分三个独立的状态,因此分类方法是一个明智的起点。您可以从本教程开始,然后按照您的建议添加一些卷积层。

还有其他方法:分类任务通常意味着每个错误的答案都是同样错误的。如果正确答案是“左”而您的算法给出的答案是“正确”,这是否比给出“中”的答案更糟糕?如果是这样,您可能会将其视为回归问题。

最后,您可能更喜欢使用AI 堆栈交换论坛来解决概念性问题,因为 stackoverflow 通常保留用于特定的编码问题。


推荐阅读