machine-learning - 对 YOLO 流程感到困惑
问题描述
为了理解这个概念,我阅读了Mauricio Menegaz写的这篇文章,并在 YouTube 上观看了Deeplearning.ai 的视频,但我对 S x S x (B * 5 +C) 部分感到困惑。我知道 S x S 代表网格大小,5 代表边界框的组件,C 代表类。B 和锚盒一样吗?如果我只想检测一个类别(例如车牌),那是否意味着只有 1 个 B?
编辑在将图像输入神经网络之前是否在图像上创建了边界框?
解决方案
B 和锚盒一样吗?
是的。B 是锚框的数量
如果我只想检测一个类别(例如车牌),那是否意味着只有 1 个 B?
不,在这种情况下,C = 1。但是如果你事先知道你需要检测的对象的宽高比,并且这个比值在视点之间变化不大,你可能只需要匹配这个比值的锚框,所以在你的车牌情况,B也可以是1
但是如果你需要检测汽车,你可能需要更多的锚框,因为汽车的宽/高比在不同的视点之间变化很大
推荐阅读
- azure - Azure RedHat vm yum 更新失败,并显示“SSL 对等方拒绝您的证书已过期。”
- mysql - 谁能解决这个mysql语句WHERE COUNT问题?
- c# - 如何检查图像是否存在于数据库中并在 c# windows 应用程序中使用组合框值显示在图片框中
- spring - 无法从链中的任何提供商加载 AWS 凭证 - 配置文件不能为空
- php - Wordpress - 使用 ajax 将数据插入数据库是个好主意吗?
- javascript - 如何处理服务器对 JQuery AJAX 请求的两个单独响应?
- appium - Appium 弹出窗口 (Android)
- angularjs - Cleave.js 不能在使用 angularjs 的平板设备中工作
- c# - C#如何存储一个浮点数并在函数中读取它
- ios - 需要模拟 Firebase Auth 但不确定如何