spacy - 使用自己的训练数据从头开始创建 NER 模型时使用的神经网络架构是什么
问题描述
当您从头开始构建自己的 NER 模型时,我似乎无法从文档中找到关于正在使用哪种类型的神经网络的明确答案。
当我从头开始构建模型时,创建的 cfg 文件显示隐藏深度 = 1 和以下设置。这是否意味着它是一个有 1 层的 CNN?
“cnn_maxout_pieces”:3,“hidden_depth”:1,“hidden_width”:128,“maxout_pieces”:2
在这次演练中,似乎表明 NER 系统很深,但在我的 cfg 中,它似乎设置为 1 个隐藏层 https://spacy.io/universe/project/video-spacys-ner-model#___gatsb
“spaCy v2.0 的命名实体识别系统具有使用子词特征和“Bloom”嵌入的复杂词嵌入策略、具有残差连接的深度卷积神经网络,以及一种新颖的基于转换的命名实体解析方法”
我不是 100% 清楚卷积层对仅 NER 场景的作用,我的训练数据只有实体,没有依赖解析或 POS
这里提到了卷积层,但它似乎只专注于依赖解析https://spacy.io/models#architecture
“我们首先为输入中的每个单词预测上下文敏感向量:”“这个卷积层在标注器、解析器和 NER 之间共享,未来的神经词元分析器也会共享这个卷积层”
解决方案
推荐阅读
- zsh - 您如何阅读 powerlevel10k 提示符中的 git 部分?
- spring-boot - 在测试 REST 端点时模拟 JWT AuthenticationPrincipal
- python - 安装tensorflow时出现KeyError
- vba - 如何延迟 Userform TextBox1_Change() 触发,直到单个输入多个字符完成?
- node.js - 获取 MongooseServerSelectionError: Hostname/IP does not match certificate's altnames: IP: xxx.xx.xx.xx is not in the cert's list:
- html - 为什么更改 div::before (悬停时)的宽度起初可以正常工作,但之后会出错?
- c# - 如何用0替换数组中的重复项
- c - SQL Server 可以执行一个小的 C 程序吗?
- java - Vandeseer 的 Easytable - 行中的多行单元格
- typescript - 泛型类型传递给的参数类型未按预期解析