deep-learning - 对约洛感到困惑
问题描述
我对 Yolo 的工作方式有点困惑。在论文中,他们说:
“置信度预测代表了预测框和任何地面实况框之间的 IOU。”
但是我们如何拥有基本事实框呢?假设我在未标记的图像上使用我的 Yolo 网络(已经训练过)。那我的信心是什么?
对不起,如果问题很简单,但我真的不明白这部分......谢谢!
解决方案
但是我们如何拥有基本事实框呢?
您似乎对什么是训练数据以及 YOLO 的输出或预测感到困惑。
训练数据是一个边界框以及类标签。这被称为“ground truth box”,b = [bx, by, bh, bw, class_name (or number)]
其中bx, by
是带注释的边界框的中点,是框bh, bw
的高度和宽度。
输出或预测是图像的边界框b
和类。形式上:注释边界框的中点在哪里。是盒子的高度和宽度,并且-在 'box'中有类的概率。c
i
y = [ pl, bx, by, bh, bw, cn ]
bx, by
bh, bw
pc
c
b
假设我在未标记的图像上使用我的 Yolo 网络(已经训练过)。那我的信心是什么?
当你说你有一个预训练的模型(你指的是已经训练过的模型)时,你的网络已经“知道”某些对象类的边界框,它会尝试估计对象在新图像中的位置,但这样做时你的网络可能会在其他地方预测边界框而不是它应该的位置。那么,您如何计算“其他地方”的盒子有多少?借条救命!IOU(Intersection Over Union)所做的是,它会为您提供重叠区域超过联合区域的分数。
IOU = Area of Overlap / Area of Union
虽然它很少是完美的或 1。它有点接近,IOU 的值越小,YOLO 参考地面实况预测边界框越差。IOU 分数为 1 表示边界框参考地面实况被准确或非常自信地预测。
推荐阅读
- scipy - 对于 Python 中给定的二项分布,binom.mean() 和 n*p 有什么区别?
- php - 为什么不从 html 表单保存到 SQL 数据库?它不显示任何错误消息
- sql - 将两个人配对的 SQL 查询
- laravel - 为什么控制器更新方法被调用两次
- mongodb - 为什么用 $out 聚合两个集合永远不会结束?MongoDB
- php - 在 WordPress 中替换页面文本的最佳方法
- node.js - 重写 npm 脚本以兼容 windows cmd
- regex - 我在 JENKINS 中的 MM/DD/YYYY 正则表达式有什么问题
- pandas - 通过布尔分隔符拆分 numpy 数组/熊猫数据帧
- java - 如何在嵌套的 SELECT 查询中使用 BeanMapHandler 与字段到列的映射,键为 ID?