deep-learning - torch.cuda.is_available() 返回 true 但 Torch 模型继续在 CPU 上进行训练
问题描述
我尝试创建一个新环境,如下所示: https ://github.com/microsoft/computervision-recipes/blob/master/SETUP.md
我检查了 cuda 运行良好,检测到我的 gpu 并且一切看起来都很好。但是当我拟合模型时,nvdia-smi 显示没有占用 GPU 并且 CPU 为 100%。
解决方案
Torch 需要为每个模型和训练过程设置 Cuda 设备,您需要手动将所有权重和另一个张量传递给 Cuda 设备。像那样:
a = torch.tensor([1, 2, 3])
a = a.to('cuda')
但就您而言,也许您需要使用库中的方法。我建议检查这个https://github.com/microsoft/computervision-recipes/blob/1bb489af757fde7c773e16fab87b24305cff4457/utils_cv/tracking/references/fairmot/trains/base_trainer.py#L32
推荐阅读
- r - 使用 purrr 的 R 多个循环,其中输出是数据表/小标题/矩阵
- macos - M1/Intel 的 Brew 变量
- python - 循环发布请求
- mysql - 有没有一种好方法可以让 MySQL 中的孩子作为一个数组?
- bash - 如何将字符串转换为修改后的十六进制表示?
- sql - SQL Case When 语句涉及 3 列
- database-design - MySQL:当用户登录其帐户时创建和存储个人用户健身数据
- http - HTTP 跟踪 - 在请求特定 url 时调用 url
- html - 即使 DevTools 正确显示按钮图标,也无法在 iPhone X 中正确呈现
- ios - 如何将环境对象从视图共享到其视图模型?