首页 > 解决方案 > gensimsimilar_by_word 函数中的相似度得分是多少?

问题描述

genismsimilar_by_word 函数中的相似度得分是多少?

我在这里阅读有关 genismsimilar_by_word 功能的信息: https ://radimrehurek.com/gensim/models/keyedvectors.html

similar_by_word 函数返回(单词,相似度)的序列。这里的相似性定义是什么,它是如何计算的?

标签: gensim

解决方案


此处使用的相似度度量是余弦相似度,取值介于 -1 和 1 之间。余弦相似度度量两个向量之间的夹角(余弦)。如果角度非常小,则向量被认为是相似的,因为它们指向相同的方向。这种测量相似度的方法在处理高维向量空间(例如词嵌入)时很常见。

A两个向量的余弦相似度公式B如下:

余弦相似度公式


推荐阅读