python - Spacy 命名实体识别问题
问题描述
我正在尝试从我正在解析的一堆文本中标记 ORG
到目前为止,我所拥有的如下:
import spacy
import en_core_web_sm
nlp = en_core_web_sm.load()
file = open("C:\\sample.txt")
doc = nlp(file.read())
print([(X.text, X.label_) for X in doc.ents])
现在,我的结果打印了所有可能的标签,我只希望它打印 ORG。关于如何做到这一点的任何建议?
解决方案
X.label_
保存实体的名称,因此您只需要添加一个条件以仅返回那些X.label_
等于的元组ORG
:
print([(X.text, X.label_) for X in doc.ents if X.label_ == "ORG"])
# ^------------------^
推荐阅读
- elixir - 如何获取请求 HTTPPoison 发送查询字符串
- angular - 从 ngx-paypal 中的可观察变量传递总值
- python - Python:如何将日期和时间(在 1 个字符串中)转换为时间戳
- r - 根据 R 中的两个索引,为每一行获取 data.frame 中的列范围
- django - 在 Django 中为模型字段生成随机字符串
- csv - 使用 ; 在文件中进行 ansible 查找 基于 2 个变量分隔
- c++ - C++ - 我想将来自字符串向量指针的数据组合成以下格式的静态字符串向量
- mysql - 远程运行存储过程时,MySQL 抛出“拒绝用户执行命令”
- azure - Azure 资源 WebApp 已部署,但无法从 url 访问
- c# - 定位报告项目,没有与顶部的硬编码距离