首页 > 解决方案 > CNN-LSTM 结构:后填充与前填充?

问题描述

在这样的结构中:CNN -> LSTM -> Dense
输入是可变长度的(例如语音识别 CTC),需要填充。
前后填充之间的选择会影响性能吗?
我阅读了填充对 LSTM 和 CNN
的影响,只要输入层是 CNN,pre vs post 是否真的不会影响性能?

标签: tensorflowkeraslstmpaddingconv-neural-network

解决方案


正如论文所示

在最初的问题中找到来源

所以如果你对 LSTM 应用后填充,你的性能显然会更差。

由于 LSTM 基于一系列数据进行学习并试图找到与过去的关系,因此在输入中添加白噪声(即 LSTM 预填充)将阻止它们建立这种关系。

如果将预填充添加到 CNN,我相信 LSTM 的性能不会受到影响,因为 CNN 的输出不会改变。

据我了解,CNN post padding 和 LSTM pre padding 是一回事,可能会导致性能更差。

一般来说,你可以通过阅读论文获得可靠的信息。在论坛中,您将了解其他人的意见。


推荐阅读