machine-learning - 对于更深层次的 CNN 层学习更复杂的特征,是否有理论解释/量化?
问题描述
我已经看到了这样的说法,即 CNN 中的深层学习识别更复杂的特征。这通常带有早期过滤器识别线条/简单曲线的图片,以及后期过滤器识别更复杂模式的图片。这很直观:你离数据越远,你对它的理解就越抽象。但是,对此有理论解释吗?
解决方案
一种非常接近直观的方法是查看每一层的感受野:
如果第一个卷积层的内核大小为 3x3,则您有一个大小为 9 的感受野,以特征图中的一个(标量)值表示。
如果你的第二个卷积层现在也有一个 3x3 的内核大小,那么你又有一个大小为 9 的感受野。但是现在感受野中有什么?它是前一层的特征图的 9 个值。现在每个值都有一个来自输入层的 9 个值的接受域,如前所述。
如果现在从 2nd Conv-Layer 的特征图回看到 Input Layer,与从 1st Conv-Layer 的特征图到输入层相比,您将拥有更宽的感受野。
所以在第二个特征图中,你会自动考虑更多的抽象特征,因为你在输入层的感受野更大。您可以在下图中很好地看到这一点,只需将“Map 1”视为输入层,将“Map 2”视为第一个 Conv-Layer 的 Feature Map,将“Map 3”视为第二个 Conv-Layer 的 Feature Map .
您将在 CNN 的CS231 课程中找到有关感受野的更多详细信息:
推荐阅读
- google-cloud-firestore - 检查用户名是否存在于firestore中并返回true swiftUI
- python - 必须运行 glob.glob 两次才能工作(Python3)
- sql - oracle CASE WHEN 语句中如何查找重复记录
- r - for 循环中的嵌套 if 语句,“条件长度 > 1 且仅使用第一个元素”
- angular - 如何将存储(用户会话)数据传递到侧菜单离子 5?
- python - 如何从numpy数组中获取分段对象的区域
- python - Paramiko 无法获取 xwindow 信息
- html - 光滑的缩略图滑块当前更改缩略图焦点需要悬停
- sql - 什么是“指定的重复键值”。AS/400 -SQL 中的错误?
- javascript - 发送带有动作触发器和 onclick 触发器的表单