nlp - 单词映射到 0 的 NLP 填充向量
问题描述
我有用户爱好的词向量,我想将其提供给神经网络嵌入层。
我的问题是:稍后要定义一个涉及矩阵乘法等的层。我需要这些向量具有相同的长度。然而,很可能一个用户有 2 个爱好 ['basketball'、'TV'],而另一个用户可能有 4 个爱好 ['basketball'、'TV'、'阅读'、'sleeping']。(它实际上是列表列表,因为例如“玩扑克”是一个有 2 个单词的爱好..)。
我想到了一个非常简单的解决方案,即获取任何用户拥有的最大爱好数量,并填充所有其他用户向量。
问题是,我想选择一个嵌入层将映射到 0 的填充,所以填充词对模型没有影响。我试过空字符串,但它不起作用,当尝试访问这样的元素时它给出了超出范围的错误(我想类似于 c 语言中的字符串..)。有什么建议吗?
解决方案
推荐阅读
- android - 在不使用 setEnabled 属性的情况下禁用按钮
- ios - 设置自定义 UIView 的不同水平对齐方式
- excel - 总结测试的分数
- typescript - 如何将小数转换为最接近的分数
- javascript - 如何将后端连接到服务器前端以使用 socket.io 与不同用户进行实时聊天
- jquery - 编辑此选择模板,以便在下拉 jquery 样式选择中将样式添加到特定单词内部选项
- python - 使用python脚本推断excel文件中的数据
- python - 使用 pandas 或 numpy 转换和绘制日期和时间
- typo3 - 如何将遗留函数 exec_SELECT_mm_query 迁移到 TYPO3 中基于 Doctrine 的 Querybuilder / Connection
- android - Firebase 数据网格视图项目在网格视图中重复