首页 > 解决方案 > SSD对象检测中的锚框和偏移量

问题描述

如何计算 SSD 中对象检测的锚框偏移量?据我了解,锚框是 8x8 特征图、4x4 特征图或输出层中的任何其他特征图中的框。

那么偏移量是多少呢?

在 4x4 特征图中,它是边界框中心与特定框中心之间的距离吗?

如果我使用 4x4 特征图作为输出,那么我的输出应该是以下维度:

(4x4, n_classes + 4)

其中 4 是我的锚框坐标。这 4 个坐标可以是:

(xmin, xmax, ymin, ymax)

这将对应于边界框的左上角和右下角。那么为什么我们需要偏移量,如果需要,我们如何计算它们?

任何帮助将非常感激!

标签: tensorflowkerasdeep-learningobject-detectionpytorch

解决方案


我们需要偏移量,因为这是我们在默认锚框时计算的值,如果 ssd 为每个特征图单元格,他们将在特征图单元格上预定义数量不同比例的锚框,我认为在论文中这个数字是 6 .

现在因为这是一个检测问题,我们也会有ground truth bounding box,这里粗略地比较anchor box和GT box的IOU,如果它大于0.5的阈值,我们预测到那个anchor的box offsets盒子。


推荐阅读