首页 > 解决方案 > 在 pytorch 中什么是 ([3,128,128]) 和只是 (3,128,128)

问题描述

我对图像形状感到很困惑。
我刚刚阅读了图像,它的形状与

img[0].shape = ([3,128,128])

([3,128,128]) 和 (3,128,128) 是什么?
我怎样才能转换它?

试图重新启动

img.shape = ([3,128,128]) 
img = cv2.resize(img,(32,32))
iamge_shape->torch.Size([1, 3, 128, 128])

跟随错误

img = cv2.resize(img,(32,32)) TypeError: Expected Ptr<cv::UMat> for argument '%s'

标签: computer-visionpytorch

解决方案


([3,128,128]) 是一个列表, (3,128,128) 是一个元组。当您查看图像的形状时,3 表示数组的维度,128,128 是行数和列数。如果我认为您已使用 opencv 读取图像,那么它将是一个 numpy 数组。请具体说明问题所在。


推荐阅读