python - 创建全卷积网络
问题描述
我正在阅读这篇研究论文完全卷积网络进行语义分割,以下是这篇论文的引述
这些网络的全连接层具有固定的维度并丢弃了空间坐标。然而,这些全连接层也可以被视为具有覆盖其整个输入区域的内核的卷积。
我不明白粗体部分,但是在互联网上进行了一些研究后,我得出的结论是,如果我删除最后一层(即全连接层),然后将最后一层(在删除全连接层之前的倒数第二层)与三个卷积1x1 内核,我将做与粗体部分相同的事情。我在这里正确吗?
为什么是三个 1x1 内核?
因为在论文中,他们从原始输入创建了一个 rgb 热图,而 rgb 表示三个通道,但是卷积网络(没有完全连接层)的结果有很多通道(高维),因此使用三个 1x1 内核进行卷积以使其成为 rbg图片。纸上的图像
解决方案
假设您在倒数第二层有一个 200X200 矩阵。然后,如果您要使用全连接层,您会将 200X200 矩阵转换为单个一维数组。这意味着一个大小为 40000 的数组。这就是丢弃空间坐标的意思。如果您正在应用 1x1 内核,同样的事情也会发生。你会得到一个类似的,像素值没有变化。
推荐阅读
- php - Facebook 自动更新长访问令牌
- c - ++*var++ 和 ++Var++ 有什么区别?
- jquery - 类型错误:表单未定义
- python - Pandas 分类数据:存储转换
- git - 当 origin/develop 领先于我的本地开发分支时 git flow release 开始
- javascript - 如何使用 jquery 或 javascript 计算其类相同但在特定内部的 html 元素
- javascript - 材质 UI 嵌套抽屉和 appbar 内带有标签的 appbar
- php - 为什么我的 php 代码在 apache、centos 7.3 中无法连接到远程 sybase 数据库,但可以在控制台中连接?
- asp.net - OpenXML:读取一个 word 文件,添加一些文本并打开它而不将其保存在 ASP.Net Web 应用程序中
- ios - 使用 Launchscreen.Storyboard 为不同的 iPhone 设备显示不同的启动图像