neural-network - 卷积的输出
问题描述
假设我们有一个 5x5 大小的图像和一个 3x3 大小的内核,其中 Stride 2 和 Padding On。通过神经网络中的卷积层后输出图像的大小是多少。
解决方案
另一个答案是正确的,但这里有一张图可以直观地说明为什么这个公式成立:
I:图像大小,K:内核大小,P:填充,S:步幅
我将仅解释单个方向的公式(将过滤器向右移动),因为它与另一个方向的原理相同。
想象一下,您将内核(过滤器)放在填充图像的左上角。
然后在右手边剩下I-K+2P个像素。如果您的步幅为 S,您将能够将内核放置在该剩余部分的floor( (I-K+2*P)/S )位置。您可以验证对于具有 4x4 像素的图像是否需要“地板”。您必须为内核的初始位置添加一个,以获得内核位置的总数。
因此总共有floor( (I-K+2*P)/S ) + 1 个位置 - 这是您的输出大小的公式。希望有帮助。
推荐阅读
- java - 将 0 到 255(1 字节)范围的 10 个不同值编码为 3 字节长度值并将其恢复为原始值
- javascript - 如何使用 Wikipedia 的 URL 获取 Wikipedia 内容?
- python - 根据数据框中的值从字典中删除嵌套的键值对
- asp.net-core - ASP.NET Core Web API 操作的永久不记名令牌身份验证
- python - conda环境需要pipwin
- c# - 在不使用开始表单或帖子的情况下将文本框的值获取到视图组件中
- python - 打开文件并将内容存储在变量中
- python - UnicodeEncodeError:“ascii”编解码器无法对位置 25-32 中的字符进行编码:序数不在范围内(128)
- python - 向量化前向传播
- python - 海龟子类“对象没有属性'_shown'”