python - LSTM 层不接受 CNN 层输出的输入形状
问题描述
我正在尝试创建一个 CNN + LSTM 网络,但 LSTM 层不接受输入形状。有什么我可以做的吗?
model = Sequential()
model.add(Conv2D(128, (2,2), padding = 'same', input_shape=(30, 216, 1)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Dropout(0.2))
model.add(Conv2D(256, (2,2), padding = 'same'))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Dropout(0.2))
model.add(LSTM(512, input_shape = (7, 54, 256,)))
model.add(Flatten())
model.add(Dense(7, activation='softmax'))
ValueError: 层 lstm_21 的输入 0 与层不兼容:预期 ndim=3,发现 ndim=4。收到的完整形状:[None, 7, 54, 256]
解决方案
Keras 中的LSTM层期望这种格式作为输入:
inputs: A 3D tensor with shape [batch, timesteps, feature].
因此,您不能直接传递非循环层。首先Flatten()
是之前的图层,然后将该图层包裹成一个TimeDistributed
图层,如下所示:
model.add(TimeDistributed(Flatten()))
model.add(LSTM(8))
这个TimeDistributed层允许将层应用于输入的每个时间切片。这是一个完整的工作示例:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, LSTM, \
Dense, Flatten, Dropout, MaxPooling2D, Activation, TimeDistributed
import numpy as np
X = np.random.rand(100, 30, 216, 1)
y = np.random.randint(0, 7, 100)
model = Sequential()
model.add(Conv2D(16, (2,2), padding = 'same', input_shape=(30, 216, 1)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Dropout(0.2))
model.add(Conv2D(32, (2,2), padding = 'same'))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Dropout(0.2))
model.add(TimeDistributed(Flatten()))
model.add(LSTM(8))
model.add(Dense(7, activation='softmax'))
model.compile(loss='sparse_categorical_crossentropy', optimizer='adam')
history = model.fit(X, y)
推荐阅读
- excel - 如何将系列集合添加到 Excel VBA 中的图表
- mysql - 如何在mysql中形成连接查询以根据某些状态条件过滤记录
- python - 动态分段每个单词的 .wav 文件
- ruby-on-rails - 为什么 bootsnap kernel_require 失败
- android - 如何在 mpandroidchart 条形图的条形顶部设置图标?
- python - 如何选择与硒元素完全相同的元素?
- twilio - Twilio我在哪里可以找到试用帐户上的 SenderID
- c# - 如何使应用程序最小化?
- android-layout - Jetpack Compose 布局挑战
- javascript - 即使在缩放时如何制作固定大小的网格?