cuda - NVIDIA Nsight Systems CLI 未获取内存统计信息
问题描述
我正在使用 NVIDIA Nsight Systems cli ( nsys
) 来分析一个简单的 cuda 程序(向量添加)。我已经检查了文档,但我认为我遗漏了一些东西。
我正在运行nsys profile
带有 --stats=true
标志的命令。
CUDA API Statistics:
Time(%) Total Time (ns) Num Calls Average Minimum Maximum Name
------- --------------- --------- ------------ ---------- ---------- ---------------------
CUDA Kernel Statistics:
Time(%) Total Time (ns) Instances Average Minimum Maximum Name
这就是我要回来的(省略值)。我应该启用某个标志来显示内存统计信息吗?
--trace=cuda
使用标志进行测试,但再次没有内存统计信息
- 主机:Windows 10
- Cuda 工具包版本:11.0
- 英伟达 Nsight 版本:2021.1.1
这是 Windows 和 Cuda 之间的兼容性问题,我应该降级吗?我真的不知道。当我在 Ubuntu 中运行相同的命令时工作正常。这真的让我发疯。
欢迎任何帮助谢谢
解决方案
您所指的内存操作统计信息跟踪统一内存 (UM)需求分页传输活动。
windows 上的 UM 模型不使用按需分页传输数据,因此您不会在 windows 上看到这些部分。
推荐阅读
- android - Firebase DataSnapshot getValue 未在初始化主体上设置属性
- oracle - 更新:功能编辑与其他设计
- c++ - 为什么我不能在我的静态函数中访问私有构造函数,如下所示?
- nginx - Kubernetes NGINX Ingress:禁用特定路径的基本身份验证
- javascript - React:当将函数传递给组件的一个实例时,为什么所有其他实例都会受到影响?
- python-3.x - 使用 urlextract 从网站中提取所有 url
- spring-boot - Shiro 中的并发会话控制
- java - 模拟通过 JSON Post 添加用户的控制器
- android - 在 GET 方法中发送 JSON 对象,并在 Android 中使用 Header
- python - for 和 while 的区别