machine-learning - CNN 能否按指定比例减小输入大小
问题描述
我有一个完全复杂的 CNN,我可以毫无问题地通过使用“相同”填充和一个步幅来设计它以具有完全相同的输出大小。
但是,我有一个图像翻译问题,我需要将输出调整为输入(W/26, H/15)
的(W, H)
大小。(事先调整图像大小是有问题的,在我们的例子中它不是一个选项)
我通过使用公式来理解:O = (I - F +2P )/s + 1
。在哪里:
O
: 输出大小I
: 输入大小F
: 过滤器尺寸P
: 填充s
: 步幅
我也许可以使用一些非常奇怪的过滤器尺寸来实现这一点。但是是否有系统或有组织的方式来构建这样一个网络以减少输入大小?
解决方案
仅使用过滤器大小和步幅来获得精确的输出大小会让您有些头疼。
我的两分钱:每当您的输出大小特别奇怪(例如(w//26, h//15)
)时,插值层可能有助于使您达到该特定大小。
例如:
- 你可以使用 PyTorch
torch.nn.functional.interpolate
。 - 张量流
tf.image.resize
推荐阅读
- objective-c - 子项目中的 Xcode 导入库头
- python-3.x - 带有python的Docker Cassandra给出连接错误
- python-3.x - 布尔运算符无法始终如一地工作。正确打印“a”,但错误打印“b”
- .net - 应用程序失败:未找到 Microsoft.AspNetCore.Antiforgery
- html - Bootstrap 可折叠不降低视差
- python - 我的浏览器可以访问的资源上的 python urllib.request 超时错误
- java - 使用 -Xss 重现 OutOfMemoryError
- javascript - JavaScript - 无法读取未定义的属性“toLowerCase”
- javascript - jstree检测多个正在移动的项目
- c# - C# 创建文件夹结构的最佳方法