neural-network - Caffe:这两个网络有什么区别?
解决方案
假设
- 权重相同(conv16 的
in_c
x16x3x3 内核分为两个in_c
x8x3x3 内核,每个内核用于 conv8 层), - 不
"Dropout"
然后两个网络计算相同的输出。但是,我怀疑第一个选项效率更高(im2col
只计算一次,不需要复制/移动数据等......)
然而,当考虑 时"Dropout"
,这两种选择不再等价,因为 conv16 的 dropout 模式对于所有 16 个训练过的过滤器都是相同的,两个 conv8 在训练期间看到不同的 dropout模式,因此可能学习不同的内核。
推荐阅读
- css - 我应该如何在 sass/css 中编写一个选择器来申请类,而不是在整个路径中有另一个类?
- python - 更改 pyplot 子图中的直方图
- java - 如何在用户按下 imageButton 之间添加延迟?
- tfs - 如何使用户能够在本地编辑 TFS 2015 中的 HtmlFieldControl 源?
- php - 如何总结国家计数以显示每个大陆的数量
- python - 以格式化的日期时间字符串显示时区名称
- mysql - 如何在 MySQL 可空日期列中按实体框架插入空值?
- angular - 如何使用 Angular 动画 sequence() 方法仅在完成后触发动画?
- android - (recyclerview-selection)在运行时改变 SelectionTracker
- database - 我应该向 UUID 列添加唯一约束吗?