pdf - 如何可视化pdf中的文本层
问题描述
我正在寻找一种从带有“文本层”的 PDF 中提取文本和该文本位置的方法。我的目标是将提取的文本作为图层显示 PDF,并让用户选择某些行作为感兴趣的区域。
pdftotext 仅向我显示行中的文本,但没有位置信息。我从 PDFlib 检查了 TET,但他们没有试用版,而且似乎不再积极维护这些库。
该程序应该可以在 Linux 上运行
解决方案
推荐阅读
- node.js - 从 res.sendFile() 获取 req 对象
- asp.net - CORS İframe 无法使用 Asp.net SessionId
- python - Twisted AMP - 如何发送大于 64K 的值
- continuous-integration - 使用 CircleCI 在持续集成中运行测试脚本?
- java - 从本地系统进程启动交互式用户进程 - 获取错误代码 5
- google-bigquery - 如何将负载均衡器日志实时导出到 BigQuery?
- typescript - 在 TypeScript 中的对象内查找类型
- python - 如何让 CTE 在我的 python 代码中工作?
- javascript - 使用媒体源扩展 API 的交互式视频
- javascript - 未捕获的类型错误:无法设置未定义的属性“显示”-如何在我的模态 JS 代码中修复它?