首页 > 解决方案 > 在 FPN 对象检测模型中使用少于 5 个锚定尺度

问题描述

通常锚点大小设置为 {32, 64, 128, 256, 512}。但是,在我的数据集中,我没有像 512 x 512 这样大的框。所以我只想使用 4 个锚比例,即 {32、64、128、256}。这怎么可能,因为 FPN 有 5 个级别?

为了详细说明,请考虑下图。(来自关于detectron2的文章)

带有 FPN 的广义 RCNN

减少锚点的数量并不是很简单,因为删除比例涉及删除正在使用的 resnet(resnet 块)的一个阶段。BoxHead 和 RPN 都需要 P2 到 P5(RPN 也需要 res5/P6)。所以我的问题是如果我要删除一个锚比例(在我的例子中是 512 x 512,因为我的图像只有 300 x 300 并且对象不会超过那个大小)应该忽略哪个 resnet 块。应该忽略低分辨率块(res2)还是应该删除高分辨率(res5)?

还是结构不允许移除锚定标尺,必须使用 5 个标尺?

标签: computer-visionobject-detection

解决方案


您可以删除锚标尺,但请注意还要修改您的 RPN 和 BoxHead。P2 将具有最大的尺寸(在您的情况下为 512)。

但也许考虑保留所有这些并仅更改分辨率,从 16 到 256。我想这可以使您免于对模型进行大量重组,并且可以改进对较小对象的检测。


推荐阅读