首页 > 解决方案 > 关于中文使用quote和coref的问题

问题描述

除了管道的其余部分,我正在尝试使用 StanfordCoreNLP 4.2.0 从中文数据中提取报价和 coref 信息。我已经能够使用以下代码使 tokenize、ssplit、pos、lemma、ner、depparse、kbp 工作:

"java -cp "+ class_path +"*; -Xmx" + memory + "g edu.stanford.nlp.pipeline.StanfordCoreNLP -props StanfordCoreNLP-chinese.properties -threads "+ nthreads +" -annotators tokenize,ssplit,pos,引理、ner、depparse、kbp" + " -filelist " + file_list + " -outputDirectory "+ output_folder + " -outputFormat xml"

但是当我向注释器添加 coref 和/或引用时,它不会输出任何文件(我当前的输出是 xml,但我也尝试了文本)。我试过了:

而且我已经尝试过使用 parse 而不是 depparse。即使只使用 tokenize、ssplit、pos、parse,我也无法让解析注释器工作——它不输出任何东西。

任何关于为什么会发生这种情况的建议将不胜感激!

标签: stanford-nlpquote

解决方案


推荐阅读