nsight-compute - 如何使用 nv-nsight-cu-cli 查找 gld_throughput 和 gst_throughput
问题描述
无法让它工作,文档阅读起来有点棘手。
在下面尝试并将输出视为 n/a。
root@teja:~/Projs/CUDA/05-Profiling# nv-nsight-cu-cli --device 0 --metrics gst_throughput,gld_throughput ./run 0
==PROF== Connected to process 28170 (/root/Projs/CUDA/05-Profiling/run)
==PROF== Profiling "Init" - 1: 0%....50%....100% - 1 pass
==PROF== Profiling "Transpose_rowRead_colWrite" - 2: 0%....50%....100% - 1 pass
==PROF== Disconnected from process 28170
[28170] run@127.0.0.1
Init(mat<int>,mat<int>), 2020-May-01 14:35:43, Context 1, Stream 7
Section: Command line profiler metrics
---------------------------------------------------------------------- --------------- ------------------------------
gld_throughput (!) n/a
gst_throughput (!) n/a
---------------------------------------------------------------------- --------------- ------------------------------
Transpose_rowRead_colWrite(mat<int>,mat<int>), 2020-May-01 14:35:43, Context 1, Stream 7
Section: Command line profiler metrics
---------------------------------------------------------------------- --------------- ------------------------------
gld_throughput (!) n/a
gst_throughput (!) n/a
---------------------------------------------------------------------- --------------- ------------------------------
解决方案
使用 Nsight Compute 工具更改了名称。
此表有助于获得新名称:https ://docs.nvidia.com/nsight-compute/2019.5/NsightComputeCli/index.html#nvprof-metric-comparison
使用以下 cmd 使其工作。
nv-nsight-cu-cli --metrics l1tex__t_bytes_pipe_lsu_mem_global_op_ld.sum.per_second,l1tex__t_sectors_pipe_lsu_mem_global_op_ld.sum,l1tex__t_bytes_pipe_lsu_mem_global_op_st.sum.per_second,l1tex__t_sectors_pipe_lsu_mem_global_op_st.sum, ./<program>
推荐阅读
- linux - 在本机库调用中找不到产生“CXXABI_1.3.9”的 AWS lambda
- html - Chrome 和 Safari HTML5 视频渲染。挂在第一帧。
- javascript - Javascript - 等待数组完成填充
- python - PyCharm 远程部署:未保存用户名
- ssl - 无法将 .CER 文件转换为 .PEM
- python - 从文本文件中读取整数,如果整数不在特定范围内,则激活 GPIO 引脚
- c++ - 如何在 C++ 上打印附加详细信息?
- c# - JSON文件中的Unity阿拉伯文本
- java - MVC SPRING HTTP 状态 500 - servlet mvc-dispatcher 的 Servlet.init() 抛出异常
- python - python2.x / 3.x中函数调用过长如何缩进