cuda - 如果 cuda 二进制文件的计算能力与当前设备的计算能力不匹配怎么办?
问题描述
在编译源代码时,我仍然无法完全理解 cuda 的计算能力。
假设二进制文件是使用从 ( code=sm_30, compute=30 ) 到 ( code=sm_62, compute=62 ) 的标志编译的(nvcc 版本是 10.1),
当图灵设备(例如,RTX2080Ti)运行这些二进制文件时会发生什么?
即使二进制文件不包含图灵架构的code=sm_75,compute=75,为什么它们在图灵设备上可以正常运行?
图灵设备JIT是否编译了compute=62的PTX代码(因为没有提到compute=75 )并在运行时生成Turing的SASS(code=sm_75)而不是65的SASS?
解决方案
推荐阅读
- cpu-architecture - perf 功耗测量:它是如何工作的?
- spring-data - 将spring数据存储库注入spring cloud函数
- javascript - 带有数组的 ES6 类默认值
- azure - Terraform 中不允许使用名称更新 AppSetting 时出错
- mysql - 有没有办法使用 Mysqldump 将所有数据库导入一个数据库?
- vue.js - Vue路由器在更改路由后使组件保持活动状态
- sql - DATE_DIFF,但只计算工作日
- r - 如何在未在参数中矢量化的自定义函数中使用 lapply 函数而不是 for 循环
- ios - 与添加到子视图的 UITableView 一起使用时,prefersLargeTitles 无法按预期工作
- apache - 浏览器不缓存静态文件