首页 > 解决方案 > 创建自定义图像数据集时出现 numpy 数组形状的问题

问题描述

我正在尝试使用 jpg 图像为深度学习项目创建自定义数据集。我需要一批读完。使用下面的代码这样做,但我的数组形状是(100, 1, 224, 224, 3)而不是(100,224, 224, 3). 有什么建议么?

path = '/content/drive/My Drive/Dataset/Training'
X=[]
for img in os.listdir(path):
    pic = cv2.imread(os.path.join(path,img))
    pic = cv2.cvtColor(pic,cv2.COLOR_BGR2RGB)
    pic = cv2.resize(pic,(224,224))
    X.append([pic])
X=np.array(X)
print(X.shape)
(100, 1, 224, 224, 3)

标签: pythonnumpykeras

解决方案


从一般的角度来看,使用squeezefromnumpy从张量中删除未使用的维度(具有单位长度)。

例如:

print(np.squeeze(X).shape)

给你:

(100, 224, 224, 3)

但也许在您的情况下,在第 7 行中使用就足够了X.append(pic)(尝试检查一下)。

提示:使用时尽量避免使用列表numpy。关于@hpaulj 评论,你可以使用concatenate功能来numpy代替列表:

# initialization like X = []
X = np.zeros([0]+list(pic.shape))
...
# append
X = np.concatenate((X, pic.reshape([1]+list(pic.shape))), axis=0)

推荐阅读