debugging - 通过 Xcode 调试金属计算着色器中的性能下降
问题描述
我曾经创建了一个金属计算着色器,它将帧作为纹理,将参数作为内存指针。但后来我意识到我可以简单地将帧作为缓冲区指针传递并保存纹理绑定调用以提高性能。此外,参数可以作为参数列表传递给着色器,而不是作为内存指针(再次提高性能)。
然而,上述更改导致着色器执行时间增加。我寻找有关如何使用计数器来识别瓶颈的参考资料,但我无法准确找到在哪里寻找 ALU 限制器计数器或纹理样本限制器计数器等。
请帮助我在哪里可以找到这些柜台。此外,我可以使用哪些技术来测量在我的计算着色器中究竟花费了比以前更长的时间?
解决方案
推荐阅读
- javascript - 使用原型定义 getter 会导致“unbound-method”ts-lint 错误
- angular - 如何在 ionic 5 angular 中创建多行离子标签?
- c++ - 有没有一种简单的方法可以将前导零添加到通过 std::to_string(int) 创建的字符串中?
- sql - Teradata:如何在特殊字符后删除部分字符串
- python - FFMPEG 使用 Python 输出到精确文件夹
- html - 根据最大内容的宽度在单独的容器中对齐匹配的内容
- flutter - 我无法生成用于分发的 apk 文件
- .net - .NET WebAPI:自定义授权标头
- google-apps-script - Google Docs - 自动更新 Google 表格中的链接对象
- r - 如何使用 dplyr 旋转复杂的整洁数据框