首页 > 解决方案 > Spacy:ner 识别的日期不正确

问题描述

我正在使用 spacy 库从文本中识别实体。当我将文本传递给 nlp 对象时,它没有正确识别日期。

文字:10 月 9 日 - 早上 8 点见我

确定->

9(作为红衣主教)

10 月 - 8 日(作为日期)

必需->

10 月 9 日(作为日期)

上午 8 点(作为时间)

在此处输入图像描述

所以你能帮我解决这个问题吗?我是nlp的初学者。

问候, 阿曼

标签: pythonnlpnltkspacy

解决方案


Spacy很好,但并不完美。看起来最好的策略是拆分文本,也许使用这样的东西:

text = 'meet me 9 Oct. - 8 am'
sections = text.split(' - ')
for section in sections:
    doc = nlp(section)
    for ent in doc.ents:
        print(ent, ent.label_)

当然,如果文本中有多个连字符,则此代码不起作用,但您明白了。


推荐阅读