首页 > 解决方案 > 从与给定日期相关的 spaCy 文本中提取日期

问题描述

给定文章的发表日期,我想提取日期,以文本形式'next week''February'从新闻文章中给出。即,如果该文章于 2019 年 2 月 13 日发布并'next week'在该文章中被提及,我希望该功能找到 2019 年 2 月 20 日的'next week'. 有人知道该怎么做吗?我正在考虑使用 spaCy 的实体查找器来完成它,然后为每个“日期”实例手动编写一个函数,但必须有更好的东西。

这是我的例子:

text = """Chancellor Angela Merkel and some of her ministers will
          discuss at a cabinet retreat next week ways to avert driving
          bans in major cities after Germany's top administrative court
          in February allowed local authorities to bar heavily polluting
          diesel cars."""
article_date = '2019-02-13'

我的理想结果如下:

 ref_dates = {'next_week': '2019-02-20',
              'february': '2019-02-01'}

标签: python-3.xspacy

解决方案


使用 CoreNLP 的 SUTime,这可以很容易地完成: https ://github.com/FraBle/python-sutime


推荐阅读