kernel - 内核中的 OpenCL 分析功能
问题描述
据我所知,内核可以通过 opencl 分析 API 进行分析。所以我只是得到内核级的性能。但是如果内核调用其他函数,我如何得到这个被调用者的分析。
静态乙{
}
内核 A {
乙();
}
解决方案
使用函数调用和注释掉的函数调用来分析内核。减去执行时间。但是请注意,如果没有结果写入全局内存,编译器不会清空内核(禁用编译器优化)。还要注意时间测量误差和不确定性,如果函数调用的时间比内核执行的其余部分要少;重复并平均时间测量以获得更准确的结果。
推荐阅读
- html - 向 Bootstrap 弹出内容添加类?
- ios - 构建失败并出现错误 Remotebuild 要求您的项目在 Xcode 8.3 中使用 cordova-ios 4.3.0 或更高版本。请更新您的 cordova-ios 版本
- wordpress - WC API,无效参数:角色
- python - Keras 中一个模型的两个输入
- java - 在 Sharepoint 中在线上传文件
- node.js - 带有firebase的node.js中的fluent-ffmpeg问题
- javascript - JSON.stringify 替换器不替换值
- calculated-field - 数据洞察 - 计算字段 - 减去总事件
- splunk - Splunk - 减去两个计数并触发警报
- mysql - 插入不存在的表中