首页 > 解决方案 > 内核中的 OpenCL 分析功能

问题描述

据我所知,内核可以通过 opencl 分析 API 进行分析。所以我只是得到内核级的性能。但是如果内核调用其他函数,我如何得到这个被调用者的分析。

静态乙{

}

内核 A {

乙();

}

标签: kernelprofilingopencl

解决方案


使用函数调用和注释掉的函数调用来分析内核。减去执行时间。但是请注意,如果没有结果写入全局内存,编译器不会清空内核(禁用编译器优化)。还要注意时间测量误差和不确定性,如果函数调用的时间比内核执行的其余部分要少;重复并平均时间测量以获得更准确的结果。


推荐阅读