首页 > 解决方案 > 输入特征到特征图

问题描述

任何人都可以向我解释这个基本的事情,即如何使用 1x1 转换映射将 192x28x28 输入图像缩减为 16x28x28 特征图。我的问题是关于当 192 到 16 时究竟会发生什么的理解?

我知道 ((I-2P-F)/S)+1,但是在减少深度的过程中会发生什么。

标签: tensorflowdeep-learningconv-neural-network

解决方案


1x1 卷积将整个 192*28*28 的输入图像(可以读取为28px * 28px像素图像的 192 个特征图)压缩成单个 1*28*28 的图像。到目前为止,它将“特征图轴”中的深度减少到 1,同时保留原始图像的高度和宽度。

但是……为什么你得到16?在卷积层中,您可以有不同的内核。基本上每个内核都是一个大小相同的独立过滤器。在你的情况下,你的 1x1 Conv 层默认有 16 个内核,因此你得到 16 个 28*28 图像(每个内核一个)。


推荐阅读