首页 > 解决方案 > 如何获取使用张量核心的 CUDA 内核的完整列表?

问题描述

当我运行 cuBLAS 或 cuDNN 操作时,我如何知道其启动的内核是否使用 Tensor Cores?

我发现nvprof 和 tensor_precision_fu_utilization 指标提供了一种方法来实现这一点。但这需要运行 nvprof 并在此指标上一一检查内核。我还发现PyProfTensorflow profiler使用内核命名规则来判断内核是否使用 Tensor Cores。他们似乎手动尝试运行每个 cuBLAS 和 cuDNN 函数并使用 nvprof 来一一判断。但我担心他们需要更新即将推出的新 GPU 架构和 NVIDIA 库更新。

是否有使用张量核心的内核的官方完整列表?

标签: nvidia

解决方案


推荐阅读