首页 > 解决方案 > Spacy 命名实体识别问题

问题描述

我正在尝试从我正在解析的一堆文本中标记 ORG

到目前为止,我所拥有的如下:

import spacy
import en_core_web_sm
nlp = en_core_web_sm.load()

file = open("C:\\sample.txt")

doc = nlp(file.read())
print([(X.text, X.label_) for X in doc.ents])

现在,我的结果打印了所有可能的标签,我只希望它打印 ORG。关于如何做到这一点的任何建议?

标签: pythonnlpspacy

解决方案


X.label_保存实体的名称,因此您只需要添加一个条件以仅返回那些X.label_等于的元组ORG

print([(X.text, X.label_) for X in doc.ents if X.label_ == "ORG"])
#                                           ^------------------^   

推荐阅读