python - 重新训练现有的 NER trf 模型
问题描述
我正在尝试en_core_web_trf
使用一些额外的日期格式更新 DATE 实体的现有 spacy 模型。
如 spacy 的文档中所述,数据已正确格式化并转换为.spacy
文件
config.cfg 文件根据链接
[components.ner]
source = "en_core_web_trf"
训练后的模型会导致灾难性的遗忘问题:
- 以前检测到某些格式被错误分类
- 更新后的 en_core_web_trf 模型无法确定任何其他现有实体,如 PERSON、ORDINAL、LOC 等。(即使
nlp.components[5][1].labels
显示所有现有实体列表)
如何在不影响默认准确性的情况下处理此问题?
解决方案
推荐阅读
- python - 在pycharm中使用anaconda(导入库报错,更新anaconda和虚拟环境)
- javascript - 刻度标签与轴标签重叠
- delphi - 有没有办法在 Firemonkey 中实现自下而上的事件通知?
- php - MAC , PHP:Failed to load resource: 服务器响应状态为 405 (Method Not Allowed)
- php - $wpdb -> get_col 返回重复的数组
- sql - 这段代码来自什么编程语言?
- c# - API 设计架构 - 反向网关?
- css - SASS:创建没有一种样式/属性的类的克隆
- nginx - Nginx infinite redirect using try_files
- javascript - How do I turn string insert data into a series for react highcharts?