首页 > 解决方案 > 为 RASA NER_CRF 创建良好数据集的约定

问题描述

我正在尝试为一种类型的实体创建一个用于训练 RASA ner_crf 的数据集。请让我知道最少的句子数量/variation_in_sentence_formation 以获得良好的结果。当我对每种可能的句子都有一种类型时,NER_CRF 并没有给出好的结果。

标签: rasa-nlucrfnamed-entity-recognition

解决方案


Rasa 实体提取在很大程度上取决于您定义的管道。还取决于语言模型和标记器。因此,请确保您使用好的分词器。如果是正常的英语发音,请尝试在 ner_crf 之前使用 tokenizer_spacy。也试试 ner_spacy

根据我的经验,每种情况下 5 到 10 种不同的表达方式一开始就给出了不错的结果


推荐阅读