首页 > 解决方案 > 以 TFIDF 作为输入的 LSTM,尺寸误差

问题描述

我正在尝试使用 TFIDF 作为输入运行 LSTM,但出现错误。我有 11915 个维度的每个条目的 TFIDF

代码如下:

## Creating model
model=Sequential()
model.add(Bidirectional(LSTM(100, input_shape=(1, 11915),return_sequences=True)))
model.add(Dropout(0.3))
model.add(Dense(1,activation='sigmoid'))
model.build(input_shape=(1, 11915))
model.compile(loss='binary_crossentropy',optimizer='adam',metrics=['accuracy'])
print(model.summary())

错误如下:双向_27层的输入0与层不兼容:预期ndim=3,发现ndim=2。收到的完整形状:[1, 11915]

我是这个领域的新手,任何帮助将不胜感激。如果有人编写一个虚拟代码来在这样的输入上运行双向 LSTM,那就太好了

我的输入是 10229*11915 的 tfidf。我想在 TFIDF 上使用 LSTM 作为输入进行假新闻检测

标签: machine-learningkerasdeep-learninglstmtf-idf

解决方案


这是一个完整的工作示例

# create fake data
n_sample = 10229
X = np.random.uniform(0,1, (n_sample,11915))
y = np.random.randint(0,2, n_sample)

# expand X to 3D
X = X.reshape(X.shape[0],1,X.shape[-1])

model=Sequential()
model.add(Bidirectional(LSTM(100, return_sequences=False), input_shape=(1, 11915)))
model.add(Dropout(0.3))
model.add(Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy',optimizer='adam',metrics=['accuracy'])
print(model.summary())

model.fit(X,y, epochs=3, batch_size=256)

发生错误是因为您可能没有正确管理您的数据。还要注意正确定义第一层并 return_sequences=False 因为你的输出是 2D


推荐阅读