首页 > 解决方案 > 对约洛感到困惑

问题描述

我对 Yolo 的工作方式有点困惑。在论文中,他们说:

“置信度预测代表了预测框和任何地面实况框之间的 IOU。”

但是我们如何拥有基本事实框呢?假设我在未标记的图像上使用我的 Yolo 网络(已经训练过)。那我的信心是什么?

对不起,如果问题很简单,但我真的不明白这部分......谢谢!

标签: deep-learningobject-recognitionyolo

解决方案


但是我们如何拥有基本事实框呢?

您似乎对什么是训练数据以及 YOLO 的输出或预测感到困惑。

训练数据是一个边界框以及类标签。这被称为“ground truth box”,b = [bx, by, bh, bw, class_name (or number)]其中bx, by是带注释的边界框的中点,是框bh, bw的高度和宽度。

输出或预测是图像的边界框b和类。形式上:注释边界框的中点在哪里。是盒子的高度和宽度,并且-在 'box'中有类的概率。ciy = [ pl, bx, by, bh, bw, cn ]bx, bybh, bwpccb

假设我在未标记的图像上使用我的 Yolo 网络(已经训练过)。那我的信心是什么?

当你说你有一个预训练的模型(你指的是已经训练过的模型)时,你的网络已经“知道”某些对象类的边界框,它会尝试估计对象在新图像中的位置,但这样做时你的网络可能会在其他地方预测边界框而不是它应该的位置。那么,您如何计算“其他地方”的盒子有多少?借条救命!IOU(Intersection Over Union)所做的是,它会为您提供重叠区域超过联合区域的分数。

IOU = Area of Overlap / Area of Union

虽然它很少是完美的或 1。它有点接近,IOU 的值越小,YOLO 参考地面实况预测边界框越差。IOU 分数为 1 表示边界框参考地面实况被准确或非常自信地预测。


推荐阅读