首页 > 解决方案 > 尝试进行 POSTtagging 时出错:加载标记器模型时出错(可能缺少模型文件)

问题描述

我正在尝试使用 windows 命令提示符将 StanfordNLP 用于克罗地亚语。我已经用 .pt 文件下载了该语言的特定模型 (hr_set_models)。

我创建了 .properties 文件,但收到以下消息:

线程“主”edu.stanford.nlp.io.RuntimeIOException 中的异常:加载标记器模型时出错(可能缺少模型文件)

分词器模型没有问题,文件 hr_set_tagger.pt 在文件夹中。

我看到model文件夹中还有一个名为hr_set.pretrain.pt的文件,不知道要不要在.properties文件中使用。

提前致谢!

Bellow 是我创建的 .properties 文件。

annotators = tokenize, ssplit, pos, lemma, depparse
# tokenize
tokenize.model = hr_set_models/hr_set_tokenizer.pt
# pos
pos.model = hr_set_models/hr_set_tagger.pt
# lemma
lemma.model = hr_set_models/hr_set_lemmatizer.pt
#depparse
depparse.model = hr_set_models/hr_set_parser.pt

标签: stanford-nlp

解决方案


您需要使用完整的 Python 系统。克罗地亚语没有 Java 模型,因此您不应该使用 Stanford CoreNLP 服务器。

这里有更多文档:https ://stanfordnlp.github.io/stanfordnlp/pipeline.html


推荐阅读