首页 > 解决方案 > Tensorflow 2.0 Conv3D input_shape 问题

问题描述

我正在尝试在视频序列上训练 CNN。我的 input_data 的形状 (5874, 1, 10, 128, 128) 代表 (n_samples, channels, frames, height , width)。错误是给出了 4 个维度但给出了 5 个预期或给出了 6 个维度。管理 Conv3D 的正确方法是什么?

Input((1,10,128,128))结果设置为:ValueError: Error when checking input: expected input_1 to have 5 dimensions, but got array with shape (1, 128, 128, 10)。但是拟合后会产生错误。

Input((1,1,10,128,128))结果设置为:ValueError: Input 0 of layer conv3d_6 is incompatible with the layer: expected ndim=5, found ndim=6. Full shape received: [None, 1, 1, 128, 128, 10]执行模型后(拟合前)

我已经浏览了所有可能的文档和论坛,但一无所获。任何提示都会有所帮助。

dataset = tf.data.Dataset.from_tensor_slices((data, labels)))
dataset = dataset.shuffle(10000)
train_dataset, valid_dataset = split_dataset(dataset, 0.02)


model = tf.keras.Sequential()
model.add(Input((1,10,128,128)))
model.add(Conv3D(filters = 8, kernel_size=(10,5,5), padding="same", activation="relu", data_format="channels_first"))
model.add(BatchNormalization())
model.add(Conv3D(filters = 8, kernel_size=(10,3,3), padding="same", activation="relu"))
model.add(BatchNormalization())
model.add(MaxPool3D(pool_size=(1,2,2), strides=(1,1,1)))

model.add(Conv3D(filters = 16, kernel_size=(5,5,5), padding="same", activation="relu"))
model.add(BatchNormalization())
model.add(Conv3D(filters = 16, kernel_size=(5,3,3), padding="same", activation="relu"))
model.add(BatchNormalization())
model.add(MaxPool3D(pool_size=(2,2,2), strides=(1,1,1)))

model.add(Conv3D(filters = 32, kernel_size=(5,5,5), padding="same", activation="relu"))
model.add(BatchNormalization())
model.add(Conv3D(filters = 32, kernel_size=(3,3,3), padding="same", activation="relu"))
model.add(BatchNormalization())
model.add(MaxPool3D(pool_size=(2,2,2), strides=(1,1,1)))

model.add(Flatten())
model.add(Dropout(0.2))
model.add(Dense(512, activation="relu"))
model.add(Dropout(0.2))
model.add(Dense(5, activation="softmax"))



model.compile(optimizer=tf.keras.optimizers.Adam(lr=0.01)  , loss="sparse_categorical_crossentropy", metrics=["accuracy"])
r = model.fit(train_dataset, verbose=1, validation_data=valid_dataset, epochs=50)

标签: pythontensorflowmachine-learningkerasconv-neural-network

解决方案


在模型中Tensorflow 在数据的开头添加了一个维度进行迭代。所以输入应该只得到最后四个维度。但fit需要 5. 使用后Dataset.from_tensor_slicesdataset.batch必须使用,否则安装时出错。


推荐阅读