首页 > 解决方案 > 如果 cuda 二进制文件的计算能力与当前设备的计算能力不匹配怎么办?

问题描述

在编译源代码时,我仍然无法完全理解 cuda 的计算能力。

假设二进制文件是使用从 ( code=sm_30, compute=30 ) 到 ( code=sm_62, compute=62 ) 的标志编译的(nvcc 版本是 10.1),

当图灵设备(例如,RTX2080Ti)运行这些二进制文件时会发生什么?

即使二进制文件不包含图灵架构的code=sm_75,compute=75,为什么它们在图灵设备上可以正常运行?

图灵设备JIT是否编译了compute=62的PTX代码(因为没有提到compute=75 )并在运行时生成Turing的SASS(code=sm_75)而不是65的SASS?

标签: cudanvidianvcc

解决方案


推荐阅读