首页 > 解决方案 > Fast R-CNN 和 SPP-net 中用于假设生成的外部算法是什么?

问题描述

我知道我们需要选择性搜索作为在 R-CNN 中生成感兴趣区域建议的外部算法,但在 Fast R-CNN 中,我们可以简单地取整幅图像,然后将其传递给卷积网络以创建特征图,然后使用单层SPP(RoI pooling layer)。

另一方面,我们在 SPP-net 中使用了多层 SPP。快速参考和理解 在此处输入图像描述

在慢速 R-CNN、SPP-net 和快速 R-CNN 中,感兴趣区域 (RoI) 来自提议方法(分别为“选择性搜索”、????)。

谁能详细解释并引用它在 SPP-net 和 Fast R-CN 中明确使用的提案方法,因为我没有在研究论文中详细提到它?

标签: computer-visionconv-neural-networkobject-detectionimage-segmentationfaster-rcnn

解决方案


官方 github repo 显示 SPP-net 和 Fast R-CNN 都使用与 R-CNN 相同的区域提议方法,即“选择性搜索”:

SPP_netFast R-CNN。在 SPP_net repo 中,有一个用于计算 region proposal 的选择性搜索模块,在 fast r-cnn repo 中,作者特别提到了计算 object proposal 的方法是选择性搜索。

但同样,生成区域提议也可以使用其他方法,因为 R-CNN 和 Fast R-CNN 采用对象提议方法作为独立于检测器的外部模块

一般来说,如果一个方法产生更多的proposals,它可以提高最终的检测精度,但这当然会限制检测速度。在Faster R-CNN 论文第 2 节“相关工作”中,对所有对象建议生成方法进行了很好的总结。

对于后续问题,即如何直观地描绘特征图中的区域提议,可以更好地用下图(参考)说明: 图像参考

图中左边的红色框经过卷积运算后会变成右边输出体积中的红色方块,绿色方块对应绿色方块等等。现在想象左边的整个7x7就是region proposal ,那么在输出的feature map上,还是一个region proposal!当然实际上左边的图像有更多的像素,所以可能有很多区域提议,每个提议在输出特征图上看起来仍然像一个区域提议!

最后,在原始SPP_net 论文中,作者解释了他们如何准确地将区域提议从原始图像转换为特征图上的候选窗口。 在此处输入图像描述


推荐阅读