首页 > 解决方案 > Spacy - 实体链接器 - 为什么预测分数是概率和余弦 sim 的组合?

问题描述

我正在通过 spacy 下的实体链接器管道的 predict 方法,由于某种原因,分数定义如下:

scores = prior_probs + sims - (prior_probs*sims)

链接在这里

任何人都有这方面的经验/知道这个公式来自哪里?

谢谢!

标签: pythonspacyentity-linking

解决方案


它取自Entity Linking via Joint Encoding of Types, Descriptions, and Context第 4 节等式 2。

尽管在详细解释公式时,我感到不够自信,但总体而言,目的是将来自外部知识资源(论文中的 KB)的实体候选者的概率分数结合起来,这是先验概率,以及估计的分数一个句子编码器,用于编码提及以链接其上下文,在公式中模拟,因为它们计算编码的提及向量和所有候选实体之间的余弦相似度(这就是为什么仅当“incl_context”为真时才使用此公式的原因) .


推荐阅读