python - 为什么在 nn.Module 中返回 self.head(x.view(x.size(0), -1)) 用于 pyTorch 强化学习示例
问题描述
我知道平衡极点示例需要 2 个输出。强化学习 (DQN) 教程
这是 self.head 的输出
print ('x',self.head)
x = Linear(in_features=512, out_features=2, bias=True)
当我运行下面的时期是输出:
print (self.head(x.view(x.size(0), -1)))
return self.head(x.view(x.size(0), -1))
tensor([[-0.6945, -0.1930]])
tensor([[-0.0195, -0.1452]])
tensor([[-0.0906, -0.1816]])
tensor([[ 0.0631, -0.9051]])
tensor([[-0.0982, -0.5109]])
...
x 的大小为:
x = torch.Size([121, 32, 2, 8])
所以我想了解 x.view(x.size(0), -1) 在做什么?
我从代码中的注释中了解到它正在返回:返回张量([[left0exp,right0exp]...])。
但是,作为 torch.Size([121, 32, 2, 8]) 的 x 是如何减少到大小为 2 的张量的呢?
有没有其他更有意义的写作方式?如果我有 4 个输出怎么办。我将如何表示?为什么是 x.size(0)。为什么是-1?
所以似乎将 self.head 与 4 个输出变为 2 个输出。那是对的吗?
在底部是我所指的那个类:
class DQN(nn.Module):
def __init__(self, h, w, outputs):
super(DQN, self).__init__()
self.conv1 = nn.Conv2d(3, 16, kernel_size=5, stride=2)
self.bn1 = nn.BatchNorm2d(16)
self.conv2 = nn.Conv2d(16, 32, kernel_size=5, stride=2)
self.bn2 = nn.BatchNorm2d(32)
self.conv3 = nn.Conv2d(32, 32, kernel_size=5, stride=2)
self.bn3 = nn.BatchNorm2d(32)
# Number of Linear input connections depends on output of conv2d layers
# and therefore the input image size, so compute it.
def conv2d_size_out(size, kernel_size = 5, stride = 2):
return (size - (kernel_size - 1) - 1) // stride + 1
convw = conv2d_size_out(conv2d_size_out(conv2d_size_out(w)))
convh = conv2d_size_out(conv2d_size_out(conv2d_size_out(h)))
linear_input_size = convw * convh * 32
self.head = nn.Linear(linear_input_size, outputs)
# Called with either one element to determine next action, or a batch
# during optimization. Returns tensor([[left0exp,right0exp]...]).
def forward(self, x):
x = F.relu(self.bn1(self.conv1(x)))
x = F.relu(self.bn2(self.conv2(x)))
x = F.relu(self.bn3(self.conv3(x)))
return self.head(x.view(x.size(0), -1))
解决方案
x.view(x.size(0), -1)
正在展平张量,这是因为线性层只接受一个向量(一维数组)。为了分解它,x.view()
重塑指定形状的张量(更多信息)。x.shape(0)
返回张量的第一维(这是批量大小,应该保持不变)。-1
in是一个填充符,x.view()
换句话说,它的维度是我们不知道的,所以 PyTorch 会自动计算它。例如,如果x = torch.tensor([1,2,3,4])
, 要将张量重塑为 a 2x2
,您可以执行x.view(2,2)
orx.view(2,-1)
或x.view(-1,2)
. 输出形状不是 的张量形状2
,而是121,2
(121
是批量大小,并且2
来自线性层output
)。因此,要将输出大小从 2 更改为 4,您必须将__init__
函数中的输出参数更改为 4。
推荐阅读
- php - PHP数组坏了?$输出=''; $输出['id']
- node.js - 请求的资源上不存在“Access-Control-Allow-Origin”标头。节点快速获取
- python-3.x - 排列列表以输出等距点
- postgresql - 在创建 REST API 以将数据存储在数据库中时,如何在 Spring Boot 中将我的表列分布在多个类中?
- python - Tensorflow '_pywrap_tensorflow_internal' 模块错误
- c# - 我无法绑定树视图上的 IsExpanded 属性
- python - 在多个条件下在 For 循环中过滤 pandas DataFrame 的更快方法
- react-native - 在我的博览会反应原生应用程序中添加飞溅时出错
- docker - 为什么我在 docker 网络示例中看到 172.22.0.3?
- django - Django 从 ManyToManyField 表单中获取对象的数据