gensim - 在具有预训练模型的 gensim 中,wmdistance 运行良好,但 n_similarity 不是
问题描述
我已经使用带有预训练模型的 gensim 的 wmdistance() 函数计算了两个句子之间的距离
现在,我想在它们之间进行相似性并尝试使用 n_similarity() 功能,但发生了 keyerror
keyerror : 单词不在词汇表中
请问有人对此有什么想法吗?
解决方案
当您收到一个单词不在词汇表中的错误时,这意味着该单词不在该模型中。
任何查找它的尝试都会生成一个KeyError
, 让您知道您正在尝试获取一个不存在的词向量。
在将它们传递给 之前,您应该过滤您的标记列表n_similarity()
,以仅包含有效单词。
当然,这意味着你无法得到关于这个词的有意义的结果'selfie'
。这对模型来说是未知的废话,就好像你问这个词一样'asruhfglaiwurfliuawiufsdfsdfs'
。
推荐阅读
- algorithm - 断开节点与图的连接
- jquery - Microsoft Edge PDF 滚动和突出显示问题
- networking - 收到RST后tcp syn重传?
- reactjs - 如何正确构建和使用 API 来为网页上的不同部分提供所需的数据?
- docker - Elasticsearch Docker,时间不是本地也不是UTC?
- c - 从 N 到 1000(包括)的数字的平均值,不包括能被 6 和 17 整除的偶数
- angular - 在 Angular 中包装 html 标签绑定的 UI 组件
- c++ - 在金属着色器代码中,如何定义函数的输入/输出参数变量?
- class - 布尔值不会将值从一个类更改为另一个
- node.js - 从 drive.files.get 获取可读流