neural-network - 卷积的输出

假设我们有一个 5x5 大小的图像和一个 3x3 大小的内核，其中 Stride 2 和 Padding On。通过神经网络中的卷积层后输出图像的大小是多少。

标签： neural-networkconv-neural-networkimage-size

另一个答案是正确的，但这里有一张图可以直观地说明为什么这个公式成立：

I：图像大小，K：内核大小，P：填充，S：步幅

我将仅解释单个方向的公式（将过滤器向右移动），因为它与另一个方向的原理相同。

想象一下，您将内核（过滤器）放在填充图像的左上角。

然后在右手边剩下I-K+2P个像素。如果您的步幅为 S，您将能够将内核放置在该剩余部分的floor( (I-K+2*P)/S )位置。您可以验证对于具有 4x4 像素的图像是否需要“地板”。您必须为内核的初始位置添加一个，以获得内核位置的总数。

因此总共有floor( (I-K+2*P)/S ) + 1 个位置 - 这是您的输出大小的公式。希望有帮助。