首页 > 解决方案 > 卷积的输出

问题描述

假设我们有一个 5x5 大小的图像和一个 3x3 大小的内核,其中 Stride 2 和 Padding On。通过神经网络中的卷积层后输出图像的大小是多少。

标签: neural-networkconv-neural-networkimage-size

解决方案


另一个答案是正确的,但这里有一张图可以直观地说明为什么这个公式成立: 在此处输入图像描述

I:图像大小,K:内核大小,P:填充,S:步幅

我将仅解释单个方向的公式(将过滤器向右移动),因为它与另一个方向的原理相同。

想象一下,您将内核(过滤器)放在填充图像的左上角。

然后在右手边剩下I-K+2P个像素。如果您的步幅为 S,您将能够将内核放置在该剩余部分的floor( (I-K+2*P)/S )位置。您可以验证对于具有 4x4 像素的图像是否需要“地板”。您必须为内核的初始位置添加一个,以获得内核位置的总数。

因此总共有floor( (I-K+2*P)/S ) + 1 个位置 - 这是您的输出大小的公式。希望有帮助。


推荐阅读