首页 > 解决方案 > 如何将序列列表中的每个序列分别提供给 Tensorflow 上的 GRU

问题描述

我实际上是在尝试实施这篇论文:https ://dl.acm.org/doi/10.1145/3323873.3326592 ,它要求我在每个评论中按列表输入所有单词 seq,例如:
[[这家餐厅,很棒] ,[这家,酒店,有,一个,很棒,服务],...]

顺便说一句,所有单词实际上都是单词索引,问题是我无法将单词嵌入层应用于每个序列中的每个单词,即使我可以将单词嵌入层应用于每个单词 id 列表,我也想不出一种将每个词嵌入序列独立地馈送到一个 GRU 层的方法。为了说明,通过输入上述词嵌入序列,我想要一个 m*n 矩阵的结果,其中“m”是嵌入大小,n 是评论数。

(更新)我在之前版本的 tensorflow(版本 0.12.1)中发现了类似的东西:https ://github.com/chenchongthu/NARRE ,其中将 seqs 中的每个 seq 提供给 CNN。
如果有人可以在 tensorflow 2.0 中复制它,我会很高兴

(更新)我试图通过在模型中使用 Keras 模型对象来设计它,但遗憾的是在子模型中遇到了批量大小问题,因为我们可以指定 LSTM 必须停止并计算另一次审查的时间长度。

(更新)我仍在尝试一些奇怪的建模,比如把它放在另一个模型的顶级模型上,但它似乎并没有起到作用。

标签: pythontensorflowkerasdeep-learning

解决方案


推荐阅读