首页 > 解决方案 > 从pytorch中的自动编码器中提取降维数据

问题描述

我在 pytorch 中定义了我的自动编码器,如下所示:

self.encoder = nn.Sequential(
    nn.Conv2d(input_shape[0], 32, kernel_size=1, stride=1),
    nn.ReLU(),
    nn.Conv2d(32, 64, kernel_size=1, stride=1),
    nn.ReLU(),
    nn.Conv2d(64, 64, kernel_size=1, stride=1),
    nn.ReLU()
)

self.decoder = nn.Sequential(
    nn.Conv2d(64, 64, kernel_size=1, stride=1),
    nn.ReLU(),
    nn.Conv2d(64, 32, kernel_size=1, stride=1),
    nn.ReLU(),
    nn.Conv2d(32, input_shape[0], kernel_size=1, stride=1),
    nn.ReLU(),
    nn.Sigmoid()
)

我需要进行降维编码,这需要创建一个维度 N 远低于图像维度的新线性层,以便我可以提取激活。

如果有人可以帮助我在解码器部分安装一个线性层,我将不胜感激(我知道如何 Flatten() 数据,但我想我需要再次“解压”它以再次与 Conv2d 层接口)

更新:

我根据第一个答案提出了以下内容(它在编码器的输出处给了我一个 8 维瓶颈,它工作得很好 torch.Size([1, 8, 1, 1]) )。

self.encoder = nn.Sequential(
    nn.Conv2d(input_shape[0], 32, kernel_size=8, stride=4),
    nn.ReLU(),
    nn.Conv2d(32, 64, kernel_size=4, stride=2),
    nn.ReLU(),
    nn.Conv2d(64, 8, kernel_size=3, stride=1),
    nn.ReLU(),
    nn.MaxPool2d(7, stride=1)
)

self.decoder = nn.Sequential(
    nn.ConvTranspose2d(8, 64, kernel_size=3, stride=1),
    nn.ReLU(),
    nn.Conv2d(64, 32, kernel_size=4, stride=2),
    nn.ReLU(),
    nn.Conv2d(32, input_shape[0], kernel_size=8, stride=4),
    nn.ReLU(),
    nn.Sigmoid()
)

我不能做的是训练自动编码器

def forward(self, x):
    x = self.encoder(x)
    x = self.decoder(x)
    return x

解码器给了我一个错误:

Calculated padded input size per channel: (3 x 3). Kernel size: (4 x 4). Kernel size can't be greater than actual input size

我要感谢提供第一个答案的人。

标签: pythonneural-networkconv-neural-networkpytorchautoencoder

解决方案


在解码器部分,您需要上采样到更大的尺寸,这可以通过nn.ConvTranspose2d. 我注意到在您的编码器部分,您似乎没有对特征图进行下采样,因为您的步幅始终为 1。这是一个玩具示例。

self.encoder = nn.Sequential(
            nn.Conv2d(32, 16, 3, stride=1, padding=1),  # b, 16, 32, 32
            nn.ReLU(True),
            nn.MaxPool2d(2, stride=2),  # b, 16, 16, 16
            nn.Conv2d(16, 32, 3, stride=1, padding=1),  # b, 32, 16, 16
            nn.ReLU(True),
            nn.MaxPool2d(2, stride=2)  # b, 32, 8, 8
        )
self.decoder = nn.Sequential(
            nn.ConvTranspose2d(32, 16, 3, stride=2,padding=1,output_padding=1),  # b, 16, 16, 16
            nn.ReLU(True),
            nn.ConvTranspose2d(16, 1, 3, stride=2, padding=1, output_padding=1),  # b, 1, 32, 32
            nn.Sigmoid()
        )

推荐阅读