首页 > 解决方案 > 如何调整 ROCm(llvm) 编译器的性能?

问题描述

我稍微修改了 llvm (roc-1.6.x) 以生成可以在 AMDGPU pro 驱动程序上运行的代码。对于相同的 opencl 代码,它可以运行,但性能比 AMDGPU 的在线编译器慢 10% 以上。我想知道是否可以设置一些标志来调整 llvm。如果你能给我一些例子,那就太好了。

标签: gpuopenclllvmamd-rocm

解决方案


推荐阅读