tensorflow - SSD对象检测中的锚框和偏移量
问题描述
如何计算 SSD 中对象检测的锚框偏移量?据我了解,锚框是 8x8 特征图、4x4 特征图或输出层中的任何其他特征图中的框。
那么偏移量是多少呢?
在 4x4 特征图中,它是边界框中心与特定框中心之间的距离吗?
如果我使用 4x4 特征图作为输出,那么我的输出应该是以下维度:
(4x4, n_classes + 4)
其中 4 是我的锚框坐标。这 4 个坐标可以是:
(xmin, xmax, ymin, ymax)
这将对应于边界框的左上角和右下角。那么为什么我们需要偏移量,如果需要,我们如何计算它们?
任何帮助将非常感激!
解决方案
我们需要偏移量,因为这是我们在默认锚框时计算的值,如果 ssd 为每个特征图单元格,他们将在特征图单元格上预定义数量不同比例的锚框,我认为在论文中这个数字是 6 .
现在因为这是一个检测问题,我们也会有ground truth bounding box,这里粗略地比较anchor box和GT box的IOU,如果它大于0.5的阈值,我们预测到那个anchor的box offsets盒子。
推荐阅读
- sbt - 如何将 scalajs 跨项目模块(js、jvm、共享)拆分为子项目?
- c# - Visual Studio 2019 中的 .Net Standard 1.0 类库
- c# - 如何获取 .csproj 文件中两个日期之间的差异?
- python - 为什么import语句有语法错误
- c++ - 指针与参考
- python - 如何通过用户名获取用户信息?
- sql - pyspark 二进制字节列中的位
- node.js - 等待然后 .then 没有得到 Axios Promise
- javascript - 带有锁定功能的 Chrome Window X 事件
- excel - 通过 Excel VBA 在 Sharepoint 上编辑文件