gpu - 如何调整 ROCm(llvm) 编译器的性能?
问题描述
我稍微修改了 llvm (roc-1.6.x) 以生成可以在 AMDGPU pro 驱动程序上运行的代码。对于相同的 opencl 代码,它可以运行,但性能比 AMDGPU 的在线编译器慢 10% 以上。我想知道是否可以设置一些标志来调整 llvm。如果你能给我一些例子,那就太好了。
解决方案
推荐阅读
- c# - 使用magick.net去除背景不是单一的纯色
- python - 如何调试此绘图问题?
- python - os.getpid 在多处理中的唯一性
- android - Android Room - 在迁移单元测试期间验证数据库索引的正确性
- python - 如何将文本文件导入 python 程序以维护嵌套列表?
- python-3.x - 如何在pyppeteer中通过xpath获取元素属性
- c - 如何在二叉搜索树中获得高度不平衡的叶节点列表?
- c++ - 如何让 ld 在 conda 中找到库
- algorithm - 红黑树和着色条件
- javascript - 如何检查/测试函数的输出而不在 React 中编译应用程序?