首页 > 解决方案 > 在具有预训练模型的 gensim 中,wmdistance 运行良好,但 n_similarity 不是

问题描述

我已经使用带有预训练模型的 gensim 的 wmdistance() 函数计算了两个句子之间的距离

现在,我想在它们之间进行相似性并尝试使用 n_similarity() 功能,但发生了 keyerror

keyerror : 单词不在词汇表中

这显示了错误示例的屏幕截图 错误示例的屏幕截图

请问有人对此有什么想法吗?

标签: gensim

解决方案


当您收到一个单词不在词汇表中的错误时,这意味着该单词不在该模型中。

任何查找它的尝试都会生成一个KeyError, 让您知道您正在尝试获取一个不存在的词向量。

在将它们传递给 之前,您应该过滤您的标记列表n_similarity(),以仅包含有效单词。

当然,这意味着你无法得到关于这个词的有意义的结果'selfie'。这对模型来说是未知的废话,就好像你问这个词一样'asruhfglaiwurfliuawiufsdfsdfs'


推荐阅读