首页 > 解决方案 > 使用 Spacy 进行 NER 训练

问题描述

在空 NER 模型上运行火车时,我应该只包含标记数据(必须包含至少一个实体的数据),还是还应该包含根本不包含任何标签的数据(在这种情况下,教模型在某些情况下,这些词没有任何标签)?

标签: pythonnlpspacy

解决方案


如果您查看 NER 的常用训练数据(您可以在http://nlpprogress.com/english/named_entity_recognition.html找到链接),您会发现大多数/每个示例都至少有一个实体。

尽管如此,该模型可能了解到大多数实体类型不会出现在任何给定的示例中。但是您总是可以尝试添加真正的否定示例,看看是否有帮助


推荐阅读