c# - iText 7 版 iTextSharp TextWithFontExtractionStrategy 解决方案
问题描述
我正在尝试解析在大多数页面上有两列文本且没有图像的 PDF 文件。我尝试使用 iTextSharp 解决方案,该解决方案可以在how can i get text formatting with iTextSharp中找到。它似乎对我有用,但后来我注意到一些相当严重的问题,即我的 PDF 中某些地方的文本被乱序返回。我只是在寻找它以与每个页面上存在的相同顺序(没有特殊顺序)解析文本,但这并没有发生。我想知道 iText 7 中是否有一个版本的 TextWithFontExtractionStrategy 解决方案不会出现这个问题(或者甚至是一个可以正常工作的 iTextSharp 版本)。我将不胜感激任何帮助。
解决方案
推荐阅读
- ruby-on-rails - 无法自定义变形 (ID)
- redis - 更改 Redis 中的最大内存策略是一项昂贵的操作吗?
- postgresql - 如何使用 LIMIT syntx 优化具有 17 个连接表的复杂查询并限制每个连接的数据
- html - 如何调整posterdown包中logo的大小
- laravel - 哪个是使用 Google Cloud Run 和 Google Cloud SQL 运行 laravel 迁移的正确方法
- azure-application-insights - 在运行时更改 Azure 应用服务上的 Application Insights 日志记录级别
- python - 将 Python 子进程输出从字符串转换为 int 或 float
- dart - Dart:具有可为空属性的自定义“copyWith”方法
- python - RDD API Python如何进行计数
- python - 来自 Tkinter 条目的打印数据不起作用