首页 > 解决方案 > 使用带有自定义数据的 spacy 可视化工具

问题描述

我想使用 Spacy 的命名实体可视化器可视化一个句子。我有一个带有一些用户定义标签的句子,我想使用 NER 渲染 API 将它们可视化。

我不想训练和生成预测模型,我已经从外部来源获得了所有需要的标签,只需要可视化而不需要过多地使用前端库。

有什么想法吗?
谢谢

标签: data-visualizationcustomizationspacynamed-entity-recognition

解决方案


您可以手动修改实体列表 ( doc.ents) 并使用标记偏移量添加新跨度。请注意,实体根本不能重叠。

import spacy
from spacy.tokens import Span
nlp = spacy.load('en', disable=['ner'])
doc = nlp("I see an XYZ.")
doc.ents = list(doc.ents) + [Span(doc, 3, 4, "NEWENTITYTYPE")]
print(doc.ents[0], doc.ents[0].label_)

输出:

XYZ NEWENTITYTYPE

推荐阅读