首页 > 解决方案 > 单词映射到 0 的 NLP 填充向量

问题描述

我有用户爱好的词向量,我想将其提供给神经网络嵌入层。

我的问题是:稍后要定义一个涉及矩阵乘法等的层。我需要这些向量具有相同的长度。然而,很可能一个用户有 2 个爱好 ['basketball'、'TV'],而另一个用户可能有 4 个爱好 ['basketball'、'TV'、'阅读'、'sleeping']。(它实际上是列表列表,因为例如“玩扑克”是一个有 2 个单词的爱好..)。

我想到了一个非常简单的解决方案,即获取任何用户拥有的最大爱好数量,并填充所有其他用户向量。

问题是,我想选择一个嵌入层将映射到 0 的填充,所以填充词对模型没有影响。我试过空字符串,但它不起作用,当尝试访问这样的元素时它给出了超出范围的错误(我想类似于 c 语言中的字符串..)。有什么建议吗?

标签: nlp

解决方案


推荐阅读