pentaho - pentaho 的“获取 XML 数据”步骤有时无法读取相同的 xml 文件
问题描述
我正在使用 pentaho 水壶工具进行 ETL 工作。在工作中,其中一个步骤(获取 XML 数据)有时无法读取/解析 xml 文件。有时同一个 XML 文件没有抛出任何异常,有时它抛出了。错误列表如下 -
- 1) 文档 file:///D:/softwares/pdi-ce-6.0.1.0-386/data-integration/UTF-8 的第 1 行出错:元素类型“Confidence”必须由匹配端终止-标签 ””。
- 2) org.dom4j.DocumentException:文档第-1 行出错:文件过早结束。嵌套异常:文件过早结束。
但是,我在 xml 文件中没有发现任何问题。有人可以就这个话题提供帮助吗?
解决方案
我没有找到根本原因,但得到了解决方案。该步骤正在解析的 xml 文件位于 zip 文件中。在解析 xml 文件之前,一个 java 步骤是解压缩 zip 文件。我没有解压缩 zip 文件,而是直接解析了 zip 中的 xml 文件。这解决了问题,并且不再报告任何错误。
推荐阅读
- javascript - 错误:请求失败,状态码为 409
- flutter - Flutter showGeneralDialog 与 Slide 和 Fade 动画
- flexdashboard - Flexdashboard 布局在 4 个方块中设置一个作为选项卡集
- mysql - 如何将一列的列值组合到 MySQL 中的另一列中?
- node.js - 我正在尝试运行 npm install 但它给了我奇怪的错误
- c# - 尽管数据被正确传递,但记录没有添加到 SQL Server?(ASP.NET WEB API 和 Angular)
- javascript - 页面重新加载时,Tweenmax 不透明度会在短时间内保持为 1
- python - Vscode keras intellisense(建议)无法正常工作
- javascript - 在 onClick 的反应调用 setTimeout 似乎不等待
- r - 如何在 R 中生成的地图中插入更多颜色