首页 > 解决方案 > pytorch克隆张量后如何计算grad

问题描述

我的简单代码:

import torch

x = torch.randn(4, requires_grad=True).cuda()
y = torch.randn(4, requires_grad=True).cuda()
z = torch.zeros(4)
z = torch.clone(x)
z.retain_grad()
h = (z + y) * z
l = torch.randn(4).cuda()
loss = (l - h).pow(2).sum()
loss.backward()
print('x.grad=', x.grad)
print('z.grad=', z.grad)

输出:

x.grad= None
z.grad= tensor([-15.3401,  -3.2623,  -2.1670,   0.1410], device='cuda:0')

为什么 x.grad 是 None 但与 z.grad 不同?如果我希望它们相同,我该怎么办?

标签: pythonpytorch

解决方案


x.retain_grad()如果要保留张量 x 的梯度,则需要在声明 x 后调用。


推荐阅读