python - 使用 Spacy 进行 NER 训练
问题描述
在空 NER 模型上运行火车时,我应该只包含标记数据(必须包含至少一个实体的数据),还是还应该包含根本不包含任何标签的数据(在这种情况下,教模型在某些情况下,这些词没有任何标签)?
解决方案
如果您查看 NER 的常用训练数据(您可以在http://nlpprogress.com/english/named_entity_recognition.html找到链接),您会发现大多数/每个示例都至少有一个实体。
尽管如此,该模型可能了解到大多数实体类型不会出现在任何给定的示例中。但是您总是可以尝试添加真正的否定示例,看看是否有帮助
推荐阅读
- c - 各种程序如何引用共享库?
- c# - UWP MediaPlayerElement - MVVM - System.Net.Http - 授权 - 如何?
- django - 如何将 id 从模板传递给视图
- javascript - 使用中间件在 Adonisjs 中定义响应结构
- google-apps-script - GmailApp.search:需要在单个线程中获取所有电子邮件
- authentication - 如何在liferay7.2登录后登陆页面前获取themeDisplay
- css - ::-webkit-scrollbar 是否可以使滚动条拇指增长而不是移动?
- mysql - Mysql order 特定值放在最后,其他的放在最前面
- awk - 使用 awk 查看日志文件输出时将时间戳转换为 UTC 偏移量
- c# - 停止错误:Chromedriver 只支持 chrome version xx (c#, Selenium)