python - Spacy - 实体链接器 - 为什么预测分数是概率和余弦 sim 的组合?
问题描述
我正在通过 spacy 下的实体链接器管道的 predict 方法,由于某种原因,分数定义如下:
scores = prior_probs + sims - (prior_probs*sims)
链接在这里
任何人都有这方面的经验/知道这个公式来自哪里?
谢谢!
解决方案
它取自Entity Linking via Joint Encoding of Types, Descriptions, and Context第 4 节等式 2。
尽管在详细解释公式时,我感到不够自信,但总体而言,目的是将来自外部知识资源(论文中的 KB)的实体候选者的概率分数结合起来,这是先验概率,以及估计的分数一个句子编码器,用于编码提及以链接其上下文,在公式中模拟,因为它们计算编码的提及向量和所有候选实体之间的余弦相似度(这就是为什么仅当“incl_context”为真时才使用此公式的原因) .
推荐阅读
- excel - 导入具有动态标题名称和动态列数的各种 CSV 文件
- amazon-web-services - Step 函数中 ECS 任务的输入和输出
- javascript - 如何使用 CSS 滤镜或 colorMatrix 将 VIBRANCE 效果应用于图像
- java - 如何使用 keytab 文件的输入流解析 Web 服务的 TGS
- javascript - 默认的 Date.toLocalDateString() 基于什么?
- angular - 在 Angular 8 中,我遇到了 Angular 中组件重叠的问题。标题组件是重叠的子组件?如何克服?
- autodesk-forge - 在 Autodesk Viewer 中打开 Excel 文件
- rest - 如何使用 RESTful API 到 Libpod 库请求具有特定构建选项的构建
- spring - 将 Richfaces 迁移到 Primefaces 时替换 FilterServletResponseWrapper。用于文件下载
- database - powerBI 中的分层数据库和递归数据显示