首页 > 解决方案 > 如何在分析命名实体时获得 Google Cloud NLU 的置信度分数?

问题描述

我有一个可以包含多个命名实体的文本(例如,一个人和两个组织)。我需要根据 Named-Entity-Tagger 的置信度选择其中一个文本。(示例在最后)

该项目在此处使用“analyzeEntities”详细信息来标记命名实体。如何获得每个标记实体的置信度?

示例: 让文本为“Homes 和 Joshua 是 StackOverflow 的两名员工”。

让我们假设标注器具有以下置信度:

Homes -> PERSON -> 0.3
Joshua -> PERSON -> 0.7
StackOverflow -> ORGANIZATION -> 0.4

我需要选择“约书亚”,因为该实体的置信度得分最高。一种方法是从服务 API 中获取置信度分数以及返回的内容。我怎样才能做到这一点?有没有办法得到上面的分数?

PS:我使用 Python 3.x,但也欢迎使用其他语言的解决方案。

标签: python-3.xnamed-entity-recognitiongoogle-cloud-nl

解决方案


目前,API 不公开任何实体预测的置信度数。它产生一个“显着性”分数,将分数与每个实体相关联,以表明它们在文本中的重要性,不要与表明模型对其预测的信心程度的置信度相混淆。


推荐阅读