python - 作为 LSTM 单元的音频帧数
问题描述
我的语音情感识别 LSTM 模型包含形状为:(4232, 400, 15) 的音频输入,即 4232 个音频文件,每个音频有 400 帧(序列数据),每帧在其之上包含 15 个特征。
LSTM / RNN 模型为序列的每个输入构建了一个单元格,因此当每个输入包含 400 帧时,这样做似乎非常合乎逻辑:
model = Sequential()
model.add(LSTM(400))
换句话说,LSTM(输入)单元的数量是由单元的数量决定的吗?
解决方案
推荐阅读
- flutter - 动态添加的小部件仅在路线更改后才有效
- java - Spring Boot SPA URL 重写
- python-3.x - Python:递归函数的意外结果
- python - 从使用多级列表标题结构化的 pdf 中提取文本的最佳方法是什么?
- forms - 如何在预设时间显示/隐藏重力形式?
- contiki - 使用 cooja 检测 WSN 中的故障节点
- python - Numpy:将最后一个轴转换为列表
- flutter - 如何在 Flutter 中使文本响应?
- scala - 如何强制 F[_] 成为 Monad 的一个实例
- bash - 如果条件避免每次在 bash 中写入 `-le 100`,我该如何组合这些 &&?