首页 > 解决方案 > 对于更深层次的 CNN 层学习更复杂的特征,是否有理论解释/量化?

问题描述

我已经看到了这样的说法,即 CNN 中的深层学习识别更复杂的特征。这通常带有早期过滤器识别线条/简单曲线的图片,以及后期过滤器识别更复杂模式的图片。这很直观:你离数据越远,你对它的理解就越抽象。但是,对此有理论解释吗?

标签: machine-learningdeep-learningconv-neural-network

解决方案


一种非常接近直观的方法是查看每一层的感受野:

如果第一个卷积层的内核大小为 3x3,则您有一个大小为 9 的感受野,以特征图中的一个(标量)值表示。

如果你的第二个卷积层现在也有一个 3x3 的内核大小,那么你又有一个大小为 9 的感受野。但是现在感受野中有什么?它是前一层的特征图的 9 个值。现在每个值都有一个来自输入层的 9 个值的接受域,如前所述。

如果现在从 2nd Conv-Layer 的特征图回看到 Input Layer,与从 1st Conv-Layer 的特征图到输入层相比,您将拥有更宽的感受野。

所以在第二个特征图中,你会自动考虑更多的抽象特征,因为你在输入层的感受野更大。您可以在下图中很好地看到这一点,只需将“Map 1”视为输入层,将“Map 2”视为第一个 Conv-Layer 的 Feature Map,将“Map 3”视为第二个 Conv-Layer 的 Feature Map .

在此处输入图像描述

您将在 CNN 的CS231 课程中找到有关感受野的更多详细信息:


推荐阅读