count - 如何计算 CUDA 中的指令数?(或每周期指令)
问题描述
我正在研究 GPGPU。
研究的目的是衡量 IPC。
但是,我没有 nsight 工具(我有,但我不能使用它),我只是在 Linux 终端中编程。
因此,我可以通过添加 clock() 函数来测量时钟周期,但我无法测量指令计数。
那么,如何获得运行 CUDA 程序的一些指令呢?
谢谢你。
解决方案
推荐阅读
- mysql - 如何修复正在搜索行并缓慢更新的数据库
- regex - 在我的正则表达式中无法匹配带有以下 \ 和所有符号的单词
- python - genfromtxt 在 Jupyter 中打开表的问题
- python - 在 Python 中按关键字对 Excel 数据表进行分类
- javascript - 当使用 Tailwind 样式的 Vue 应用程序中出现新 div 时,如何在不向下滚动的情况下自动进入页面底部?
- google-api - 我们能否向注册了 Android Management API 解决方案的手机发送通知(谷歌)
- r - sapply + if - 保留列名
- python - 将存储在元组中的“时间值”转换为 24 小时格式
- javascript - XLSX 到 CSV 文件转换为 API 调用
- c - PIC 编程计数器和触摸传感器问题