首页 > 解决方案 > 神经网络中图像的默认输入尺寸?

问题描述

阅读 PyTorch 书籍时,我遇到了作者更改轴顺序的这段代码。

img_t.permute(1, 2, 0) (将轴的顺序从 C × H × W 更改为 H × W × C)

H x W x C 是神经网络中输入图像的默认输入尺寸吗?

标签: deep-learningpytorchconv-neural-network

解决方案


在 PyTorch 中,输入是形​​状为 N x C x H x W 的浴缸。所以 N 是批量大小,C 是图像通道的数量,如您所知,H 和 W 是高度和宽度。但是当您使用例如 cv2 时,图像的默认形状是 HxWxC,因此您需要交换 pytorch 的尺寸。


推荐阅读