named-entity-recognition - IBM Watson NLU 中货币实体到实体提取的低分
问题描述
我正在尝试使用 NLU 和 WKS 从文本文档中提取一些实体和关系。我得到了很好的结果,但我想了解为什么 Watson NLU 在类似文档中无法识别我的自定义模型的某些实体,例如:
Text 1 in Portuguese: "Dá à causa o valor de R$ 10.000,00" => DIDN´T WORK
Text 2 in Portuguese: "Dá à causa o valor de R$ 20.000,00" => WORKED!
Text 3 in Portuguese: "Dá à causa o valor de R$ 10.000,01" => WORKED!
Watson 在 Text 2 和 Text 3 上识别出我的实体和关系,但在 Text 1 中却没有。同样的事情发生在:
Text 4 in Portuguese: "Dá à causa o valor esperado de R$ 20.000,00" => DIDN´T WORK
Text 5 in Portuguese: "Dá à causa o valor de R$ 20.000,00" => WORKED!
标记的文档样本:
数据集:
- 训练集:250 个文档(85%)
- 测试集:35 个文档(12%)
盲集:10 份文件 (3%)
我已经使用了其他拆分。
- 所有文档都有实体和关系,一次按文档,有差异。
我已经用这种情况标记了更多文档,但它并没有改善结果。另一项测试是将任何货币标记到文件中。
我可以做些什么来改善结果?
解决方案
推荐阅读
- python - 如何在 OpenTurns Viewer 上设置轴限制?
- r - 如何根据字符串进行过滤
- php - 使用 Discord API 的 cURL PUT/PATCH 请求导致错误 400(错误请求)
- javascript - 尝试在 React 中调度按键事件
- react-native - 从对象数组中更改选定项的边框颜色
- c# - 神秘段故障
- java - 如何发送 HTML 电子邮件 Android
- java - 实现接口的枚举类的 Java 数组也接受其他未实现接口的枚举
- .net - CORS 策略:对预检请求的响应未通过访问控制检查:预检请求不允许重定向 - AWS CloudFront
- npm - 如何在尊重 package-lock.json 的同时“npm install packageX”