pytorch - 将图像馈送到堆叠的 resnet 块以创建嵌入
问题描述
我想知道为什么我们要堆叠多个 resnet 块,而不是像更传统的架构中的多个卷积块?任何代码示例或引用一个都将非常有帮助。
另外,我怎样才能将它转移到像下面这样可以包含每个 resnet 块的自我注意模块的东西?
解决方案
在输入图像的高分辨率下对 Resnet 块的输出应用 self-attention 可能会导致内存问题:self-attention 块的内存需求随输入大小(=分辨率)呈二次方增长。这就是为什么在例如Xiaolong Wang、Ross Girshick、Abhinav Gupta、Kaiming He Non-Local Neural Networks (CVPR 2018) 中,他们只在架构的非常深的层引入自我注意,一旦特征图基本上低于采样。
推荐阅读
- macos - 即使在调整权限后运行“mvn clean install”时反复出现“无法从...复制完整内容”
- ag-grid - ag-grid 的 agSelectCellEditor 无法正确渲染单元格
- javascript - Bootbox alert doesn't show up in Laravel view
- android - 如何从 SoapObject 中删除属性?
- javascript - 从列选项获取调用表
- python - 使用脚本参数在 Snakemake 中指定 Python 版本
- sql - 表上的选择性删除权限可能吗?
- ruby - rails:查找外键日期在一定范围内的模型对象
- python - 对象没有附加到文件 python 的属性“writerow”
- dart - 在 Firebase 控制台中看不到颤振屏幕类