首页 > 解决方案 > 如何可视化pdf中的文本层

问题描述

我正在寻找一种从带有“文本层”的 PDF 中提取文本和该文本位置的方法。我的目标是将提取的文本作为图层显示 PDF,并让用户选择某些行作为感兴趣的区域。

pdftotext 仅向我显示行中的文本,但没有位置信息。我从 PDFlib 检查了 TET,但他们没有试用版,而且似乎不再积极维护这些库。

该程序应该可以在 Linux 上运行

标签: pdfocrpdftotext

解决方案


推荐阅读