首页 > 解决方案 > 在深度学习中,两个 3*3 卷积滤波器和一个 5*5 卷积滤波器有什么区别?

问题描述

例如,对于famous AlexNet architecutre (原始论文)two 3*3 convolution filters , using和 using有什么区别one 5*5 convolution filter

和已在下图中突出two 3*3 convolution filters显示。one 5*5 convolution filterred rectangle

https://medium.com/@smallfishbigsea/a-walk-through-of-alexnet-6cbd137a5637

在此处输入图像描述

用另一个5*5 convolution filter来取代two 3*3 convolution filters, 或反之亦然呢?

标签: deep-learningconv-neural-network

解决方案


我从纸上找到了<<Very Deep Convolutional Networks for Large-Scale Image Recognition>>

而不是在第一个 conv 中使用相对较大的感受野。层(例如,11×11 步长为 4 英寸(Krizhevsky 等人,2012),或 7×7 步长为 2 英寸(Zeiler & Fergus,2013;Sermanet 等人,2014 年)),我们使用非常小的 3×3 接受层整个网络中的字段,它们与每个像素的输入进行卷积(步长为 1)。很容易看出,两个 3×3 卷积层(中间没有空间池化)的堆栈具有 5×5 的有效感受野;三个这样的层具有 7 × 7 的有效感受野。

  1. 两个 3*3 卷积滤波器相当于一个 5*5 卷积滤波器。

  2. 两个 3*3 卷积滤波器的参数将少于一个 5*5 卷积滤波器。

  3. 两个 3*3 的卷积滤波器比一个 5*5 的卷积滤波器会使网络更深,提取更复杂的特征。

论文:https ://arxiv.org/pdf/1409.1556.pdf


推荐阅读