opennlp - Apache OpenNLP 在运行其命名实体识别 (NER) 模型时默认使用哪些功能?
问题描述
我知道 Apache OpenNLP 将 MaxEnt 模型用于其 NER 标记器。但是,Apache OpenNLP 在运行其命名实体识别 (NER) 模型时(默认情况下)使用了哪些功能?以及我们如何在 OpenNLP(Java 实现)中合并/自定义新功能?
解决方案
在 Apache OpenNLP NER 中,它允许用户通过 XML 文件定义特征。默认的 XML 是这样的:
如果要自定义它,-featuregen
请在训练模型时使用选项:
$ opennlp TokenNameFinderTrainer -featuregen your-features-definition.xml -model my-model.bin ...
当您执行 TokenNameFinder 时,您不需要指定您自定义的特征 XML 文件,因为模型文件包含您的特征信息。
推荐阅读
- node.js - 在执行下一个函数之前等待 writestream 完成
- nativescript - 无法正确安装javac
- python - Pyinstaller / auto-py-to-exe 附加文件
- regex - sed 在长数字的数字之间插入空格
- python - Scipy 错误 - ValueError:行索引超出矩阵维度
- reactjs - 使用 useEffect 更新 redux 存储
- mysql - 根据多个标签查找产品
- python - 从列表列表中过滤值
- yii - 从 Url 获取参数到 Yii2 模型
- c++ - 使用类型对的元素对 std::vector 进行排序
, 但顺序相反