deep-learning - 描述基于 LSTM 层/网络的工作负载时缺少特征大小

首页 > 解决方案 > 描述基于 LSTM 层/网络的工作负载时缺少特征大小

问题描述

LSTM 网络的输入张量形状是 [batch, timesteps, features]。但是在很多地方，我只看到了 LSTM 内核的批量大小和时间步数（除了隐藏大小之外）。

一些例子：

在定义 DeepBench 基准时（https://github.com/baidu-research/DeepBench）。在页面上搜索“Recurrent Ops Results”。
在 Microsoft Brainwave ISCA'18 论文中 ( https://www.microsoft.com/en-us/research/uploads/prod/2018/06/ISCA18-Brainwave-CameraReady.pdf )。见表五。

我对为什么缺少特征维度感到困惑。是否有必要指定特征数量（或嵌入大小）以使用 LSTM 内核/网络完全指定工作负载？

标签： deep-learninglstmrecurrent-neural-network

解决方案

推荐阅读