首页 > 解决方案 > 描述基于 LSTM 层/网络的工作负载时缺少特征大小

问题描述

LSTM 网络的输入张量形状是 [batch, timesteps, features]。但是在很多地方,我只看到了 LSTM 内核的批量大小和时间步数(除了隐藏大小之外)。

一些例子:

  1. 在定义 DeepBench 基准时(https://github.com/baidu-research/DeepBench)。在页面上搜索“Recurrent Ops Results”。

  2. 在 Microsoft Brainwave ISCA'18 论文中 ( https://www.microsoft.com/en-us/research/uploads/prod/2018/06/ISCA18-Brainwave-CameraReady.pdf )。见表五。

我对为什么缺少特征维度感到困惑。是否有必要指定特征数量(或嵌入大小)以使用 LSTM 内核/网络完全指定工作负载?

标签: deep-learninglstmrecurrent-neural-network

解决方案


推荐阅读