filter - How do successive convolutional layers work?
问题描述
If my first convolution have 64 filters and my second has 32 filters. Will i have :
1 Image -> Conv(64 filters) -> 64 ImagesFiltred -> Conv(32 filters) -> 64 x 32 = 2048 Images filtred
Or :
1 Image -> Conv(64 filters) -> 64 ImagesFiltred -> Conv(32 filters) -> 32 Images filtred
If it is the second answer : what are goin on between the 64 ImagesFiltred and the second Conv ??
Thanks for your answer, in don't find a good tutorial that explain clearly, it always a rush ...
解决方案
你的第一点是正确的。卷积本质上是从数据中改变和提取特征的方法。我们通过创建 m 个图像来做到这一点,每个图像都查看原始图像的特定帧。在第一个卷积层上,我们为第一层中的每个卷积图像拍摄 n 幅图像。
SO:k1 *k2 将是图像的总数。
为了进一步说明这一点,卷积通过制作图像的特征图来工作。当你有连续的卷积层时,你正在制作特征图的特征图。即,如果我从 1 个图像开始,并且我的第一个卷积层的大小为 20,那么在卷积 1 结束时我有 20 个图像(更具体地说是特征图)。然后假设我添加了大小为 10 的第二个卷积。会发生什么然后我为每 1 张图像制作 10 张特征图。因此,它将是 20*10 图像 = 200 个特征图。
例如,假设您有一个 50x50 像素的图像。假设您有一个卷积层,其过滤器大小为 5x5。如果您没有填充或其他任何东西,会发生什么情况)是您在图像上“滑动”并在每次滑动迭代时获得像素的加权平均值(取决于您的位置)。然后你会得到一个大小为 5x5 的输出特征图。假设您执行此操作 20 次(即 5x5x20 卷积),然后您将获得 20 个大小为 5x5 的特征图作为输出。在下面的 VGG 神经网络帖子中提到的图表中,该图表仅显示了为传入特征图制作的特征图数量,而不是特征图的最终总和。
我希望这个解释是彻底的!
推荐阅读
- c# - 使用 OleDB 在 DBase III DBF 文件中插入日期
- c# - 即使是无效的 url,HttpClient 请求也会返回 200 OK
- javascript - Javascript 地图问题。Evaluate() 中的并行参数
- vue.js - 为什么这个Vue JS方法函数validEmail没有定义
- unix - 如何通过unix重命名目录中的大量文件
- authentication - 创建自定义基于用户的身份验证以用于 Blazor 服务器与身份身份验证
- c# - 我收到 500 内部服务器错误,但我不明白为什么
- asp.net-core - 到事件存储问题的 TCP 连接/配置
- python - PyModuleDef_HEAD_INIT 未包含在 Python.h 中?
- java - 在 JLabel 中导航和删除对象列表