首页 > 解决方案 > 创建全卷积网络

问题描述

我正在阅读这篇研究论文完全卷积网络进行语义分割,以下是这篇论文的引述

这些网络的全连接层具有固定的维度并丢弃了空间坐标。然而,这些全连接层也可以被视为具有覆盖其整个输入区域的内核的卷积

我不明白粗体部分,但是在互联网上进行了一些研究后,我得出的结论是,如果我删除最后一层(即全连接层),然后将最后一层(在删除全连接层之前的倒数第二层)与三个卷积1x1 内核,我将做与粗体部分相同的事情。我在这里正确吗?

为什么是三个 1x1 内核?

因为在论文中,他们从原始输入创建了一个 rgb 热图,而 rgb 表示三个通道,但是卷积网络(没有完全连接层)的结果有很多通道(高维),因此使用三个 1x1 内核进行卷积以使其成为 rbg图片。纸上的图像

标签: pythontensorflowconv-neural-network

解决方案


假设您在倒数第二层有一个 200X200 矩阵。然后,如果您要使用全连接层,您会将 200X200 矩阵转换为单个一维数组。这意味着一个大小为 40000 的数组。这就是丢弃空间坐标的意思。如果您正在应用 1x1 内核,同样的事情也会发生。你会得到一个类似的,像素值没有变化。


推荐阅读