apache - 没有得到 uima ruta 的输出
问题描述
我正在使用 eclipse 处理 UIMA Ruta,在其中我创建了注释器来获取文本,注释器突出显示所需的文本,但是由 Ruta(遵循注释器规则)创建的输出文件是 XML 格式的。我想知道如何在单独的文本文件中生成注释器的输出。
我尝试使用 Ruta 查询获取输出,但结果显示在不保存输出的新弹出窗口中,参考文档,知道我应该手动保存输出
想要获取仅保存注释器输出的文本文件。
解决方案
由于 UIMA Ruta 是 Apache UIMA 文本处理框架的一部分,为了单独保存使用 Ruta 创建的注释,您需要从使用 UIMA 生成的 Ruta 输出中获取所需的注释。
可以在此处找到使用 UIMA 的良好起点
基本上,一旦有了 jCas,就可以使用以下命令提取所需的注释:
Collection<YourAnnotationType> annotations = JCasUtil.select(jCas, YourAnnotationType.class);
从这里开始,annotations
(连同它们的功能)可以保存到外部 CSV 文件中。
推荐阅读
- python - 在 Visual Studio 2019 的 Windows 中使用 CMake 使用 contrib 构建 openCV 时出现问题
- python - CPython 源代码中的列表推导在哪里实现?
- iis - IIS7 - 重写公用文件夹中的文件和子目录
- stata - 如何将一个变量的内容替换为另一个变量的内容?
- node.js - 使用带有 NestJS 的 aws 加密库的“EC2 元数据角色名称请求返回错误”
- flutter - Flutter:如何创建并公开图片到公共下载文件夹?
- sql - SQL Group By 不同列上的多个值
- javascript - 如何仅旋转 div 内的内容?
- .net - foreach Azure.Pageable
然后抛出 System.FormatException - python - 使用 FORMDATA 的 scrapy 问题使用凭据抓取网站