computer-vision - 针对低内存集成设备(例如 arm 处理器/GPU)优化 GPU 卷积?
问题描述
我希望在 arm Mali GPU 上实现卷积并希望它针对速度和内存进行优化?最好的方法是什么?基于 GEMM 的 MCMK 卷积不适合,因为它们会占用大量内存。此外,GPU 上的直接实现比相应的 CPU 版本要慢得多。在时序计算中应考虑到内存重塑的任何时间。
解决方案
推荐阅读
- c# - 视图模型上的 Xamarin 绑定属性:无法识别视图模型
- vue.js - 如何更改 vue.js 应用程序的名称
- javascript - 如何在 Visual Studio Code 中显示“console.log”输出?
- javascript - 来自两个 li 元素的逗号分隔列表
- javascript - 如何在 Vue.js 的编辑文件输入中赋予文件值?
- python - 正则表达式字符串模式插入操作
- css - 表格 css 在缩小窗口时搞砸了
- c# - 启用 Cors NetCore React 前端
- javascript - Bootstrap modal close modal onclick
- python - 如何在 Jupyter 笔记本中重绘 matplotlib.pyplot 图?