首页 > 解决方案 > 使用自己的训练数据从头开始创建 NER 模型时使用的神经网络架构是什么

问题描述

当您从头开始构建自己的 NER 模型时,我似乎无法从文档中找到关于正在使用哪种类型的神经网络的明确答案。

当我从头开始构建模型时,创建的 cfg 文件显示隐藏深度 = 1 和以下设置。这是否意味着它是一个有 1 层的 CNN?

“cnn_maxout_pieces”:3,“hidden_​​depth”:1,“hidden_​​width”:128,“maxout_pieces”:2

在这次演练中,似乎表明 NER 系统很深,但在我的 cfg 中,它似乎设置为 1 个隐藏层 https://spacy.io/universe/project/video-spacys-ner-model#___gatsb

“spaCy v2.0 的命名实体识别系统具有使用子词特征和“Bloom”嵌入的复杂词嵌入策略、具有残差连接的深度卷积神经网络,以及一种新颖的基于转换的命名实体解析方法”

我不是 100% 清楚卷积层对仅 NER 场景的作用,我的训练数据只有实体,没有依赖解析或 POS

这里提到了卷积层,但它似乎只专注于依赖解析https://spacy.io/models#architecture

“我们首先为输入中的每个单词预测上下文敏感向量:”“这个卷积层在标注器、解析器和 NER 之间共享,未来的神经词元分析器也会共享这个卷积层”

标签: spacy

解决方案


推荐阅读