首页 > 解决方案 > NVIDIA Nsight Systems CLI 未获取内存统计信息

问题描述

我正在使用 NVIDIA Nsight Systems cli ( nsys) 来分析一个简单的 cuda 程序(向量添加)。我已经检查了文档,但我认为我遗漏了一些东西。

我正在运行nsys profile带有 --stats=true标志的命令。

CUDA API Statistics:

 Time(%)  Total Time (ns)  Num Calls    Average      Minimum     Maximum            Name
 -------  ---------------  ---------  ------------  ----------  ----------  ---------------------

CUDA Kernel Statistics:

 Time(%)  Total Time (ns)  Instances    Average      Minimum     Maximum                       Name

这就是我要回来的(省略值)。我应该启用某个标志来显示内存统计信息吗?

--trace=cuda使用标志进行测试,但再次没有内存统计信息

这是 Windows 和 Cuda 之间的兼容性问题,我应该降级吗?我真的不知道。当我在 Ubuntu 中运行相同的命令时工作正常。这真的让我发疯。

欢迎任何帮助谢谢

标签: cudanvidiansight

解决方案


您所指的内存操作统计信息跟踪统一内存 (UM)需求分页传输活动。

windows 上的 UM 模型不使用按需分页传输数据,因此您不会在 windows 上看到这些部分。


推荐阅读