java - 解析文档时如何用另一个字符串替换文档中字符串的一部分
问题描述
我有一个已解析的 PDF 文档,我使用 java 中的库对其进行了解析。问题是文档中的表格没有正确解析,它被解析为文本(逐行)。所以我在 Python 中使用了一个名为 Camelot 的库,它为我提供了解析后的表格格式,然后我将其发送给了 java。我需要用来自 Camelot 的表格替换 PDF 解析表格,并保持其余表格完整。文档中有多个表,因此解析的表作为字符串列表返回,每个索引给出每个表的解析值。
该boundaryEND
标签表示 Camelot 输出的附加图像中每个表格的结尾。
我尝试通过调用该allmatch()
方法来使用流,但无法替换该部分,因为allmatch()
给出了boolean()
值(仅指示字符串是否匹配,而不是这样给出元素)。camelot 的输出是这样的
解决方案
这可以通过使用自定义收集器的 Stream API 来完成。检查此链接:使用 Stream api 根据条件将列表拆分为子列表
推荐阅读
- riscv - GCC 上的 RISC-V 程序集 - 为什么会生成冗余 mv 命令?
- python - 为什么 cv2.namedWindow 不起作用?
- javascript - 为什么当我使用`useState`时`setTimeout`调用不止一次?
- android - 具有委托 gpu 的 TFlite 给出错误的结果
- typescript - 从类型的默认参数推断 TypeScript 类型
- git - git diff --stat 输出中的 3 个前导点 (...) 代表什么
- javascript - 如何一键在单独的选项卡中打开 4 个网址
- java - printenv 从服务启动时不返回任何内容
- c++ - 如何检查驱动器是否已连接(安装)?
- c# - OracleDataReader[columnName] 返回错误的小数位