pdf2json - 如何在nodejs中解析PDF
问题描述
我正在尝试解析pdf并根据文本格式/装饰对信息进行分类。你建议我怎么做?例如,我有一个重复结构的pdf:
S.No. BOLD+UNDERLINED TITLE para
如何根据文本修饰将此数据分类为对象数组:
[
{ sno: "", title: "", desc: "" },
...
]
解决方案
推荐阅读
- angular - 在 Angular/NgRx 中获取数据后,如何仅订阅 observable?
- c# - 使用 ServiceStack.OrmLite 异步 API 时出现奇怪的 NullReferenceException
- flutter - 出现错误“Kotlin 在 Java 安装中找不到所需的 JDK 工具”
- ms-word - 当范围内有两个超链接时,office.js range.load('text') 不会返回所有文本
- php - 如何对foreach中的对象数组进行排序?(更新)
- android - Plugin "Android Bundle Support" is incompatible
- markdown - 如何在 Markdown 中折叠表格?
- firebase - Flutter Firestore:有没有办法根据另一个集合的文档获取另一个集合的文档?
- python - 过滤后台进程 PyWin32
- javascript - 检查事件目标是文件还是值