rasa-nlu - 为 RASA NER_CRF 创建良好数据集的约定
问题描述
我正在尝试为一种类型的实体创建一个用于训练 RASA ner_crf 的数据集。请让我知道最少的句子数量/variation_in_sentence_formation 以获得良好的结果。当我对每种可能的句子都有一种类型时,NER_CRF 并没有给出好的结果。
解决方案
Rasa 实体提取在很大程度上取决于您定义的管道。还取决于语言模型和标记器。因此,请确保您使用好的分词器。如果是正常的英语发音,请尝试在 ner_crf 之前使用 tokenizer_spacy。也试试 ner_spacy
根据我的经验,每种情况下 5 到 10 种不同的表达方式一开始就给出了不错的结果
推荐阅读
- sql - SQL 中 2 列的 % 差异
- tcl - 在 TCL 上读取和重写特定行
- r - 使用标题滚动/平移ggplotly
- android - Android Q:获取已配置网络的列表
- c# - 如何评估 IDebugProperty2 的参考?
- mysql - MySQL Workbench 用于连接 MySQL 服务器的驱动程序
- javascript - 用于自定义属性的 addEventListener 的 jQuery 替代方案
- javascript - 如何将数据从映射对象传递到 React 中的父组件?
- angular - 为什么我的 ngrx Effect 将字符串参数转换为数组?
- node.js - desktopCapturer 示例...如何使其适用于特定应用程序