首页 > 解决方案 > 从已经裁剪的图像中制作 YOLO 或 PascalVOC

问题描述

我有一个现成的图像数据集,其中用于识别的对象已经沿着该对象的边界被切断,并且不需要在任何标记程序(例如 LabelImg)中使用矩形标记来选择它。当然,有一个程序代码或程序可以从这样一个准备好的图像数据集中制作 YOLO 或 PascalVOC 文件。我寻求帮助以寻找...

在这里我找到了一个答案,这对于 YOLO(没有背景)是不可能的,但是对于 PascalVOC(我想与 Tensorflow 对象检测一起使用)有可能解决这个问题:YOLO Annotation Files for Already-Cropped Images

标签: tensorflowartificial-intelligenceyoloobject-detection-apilabelimg

解决方案


首先,您似乎要做的是图像分类(将类/类别/标签分配给图像的任务

对于 YOLO,它做了两件事:定位(定位图像中对象的存在并在其周围绘制一个边界框)然后对边界框内的对象进行分类。这种组合称为对象检测(见下图)

在此处输入图像描述

对于对象检测任务,在训练数据集中以未裁剪图像表示目标对象很重要。这允许 YOLO 了解哪个是背景,哪个是目标对象

在您的情况下,您的数据集已经被裁剪。如果您的测试集未裁剪,YOLO 将无法学习如何区分您的“对象”和“背景”

但是,如果您的测试集也被裁剪,我建议使用图像分类模型而不是 YOLO。


推荐阅读