stanford-nlp - 关于中文使用quote和coref的问题
问题描述
除了管道的其余部分,我正在尝试使用 StanfordCoreNLP 4.2.0 从中文数据中提取报价和 coref 信息。我已经能够使用以下代码使 tokenize、ssplit、pos、lemma、ner、depparse、kbp 工作:
"java -cp "+ class_path +"*; -Xmx" + memory + "g edu.stanford.nlp.pipeline.StanfordCoreNLP -props StanfordCoreNLP-chinese.properties -threads "+ nthreads +" -annotators tokenize,ssplit,pos,引理、ner、depparse、kbp" + " -filelist " + file_list + " -outputDirectory "+ output_folder + " -outputFormat xml"
但是当我向注释器添加 coref 和/或引用时,它不会输出任何文件(我当前的输出是 xml,但我也尝试了文本)。我试过了:
- 标记化,ssplit,pos,引理,ner,depparse,kbp,quote,coref
- 标记化、分割、pos、引理、ner、depparse、kbp、报价
- 标记化,ssplit,pos,lemma,ner,depparse,kbp,coref -coref.algorithm 神经
- 标记化,ssplit,pos,引理,ner,depparse,kbp,coref
而且我已经尝试过使用 parse 而不是 depparse。即使只使用 tokenize、ssplit、pos、parse,我也无法让解析注释器工作——它不输出任何东西。
任何关于为什么会发生这种情况的建议将不胜感激!
解决方案
推荐阅读
- php - MasterFormat 分类正则表达式
- azure-resource-manager - Azure 服务运行状况 | 所有类型的健康警报
- windows - 如何使用“buildfire run”命令?
- airflow - 气流从气流 UI 中禁用“删除 DAG”选项
- ruby - 如何通过带有总和和平均值的哈希键进行分组
- azure - 如何让公共 Azure AppService 应用与许多私有 Azure AppService 应用通信?
- c - 有人可以解释为什么下面的代码打印 -1
- mysql - 高效的 ORDER BY 与大型表上的依赖子查询
- c++ - 类模板参数推导 - clang 和 gcc 不同
- java - 通过继承运行时异常来“绕过” throws 子句