javascript - 从 pdf 文件中读取注释
问题描述
我有一个 PDF 文件,其中包含注释和注释建议,这些注释出现在带注释的单词上。
例如,考虑上面的图像,其中您将使用的单词是删除线(表示不正确的单词),并且在鼠标悬停时会显示弹出窗口,其中出现了正确的单词。同样,还有另一个插入符号也是如此。
我想提取两个单词的列表,这将显示文件中正确和不正确的单词。
解决方案
你试过这个解析器吗?
特征
- 加载和解析对象和标题
提取元数据(作者、描述、关键字,...)
从有序页面中提取文本
支持压缩 pdf(和非压缩 pdf)
支持字符集编码(WinAnsi、MacRoman)
处理六进制和八进制内容编码
PSR- 0 兼容(自动加载器)
兼容 Composer
PSR-1 兼容(代码样式)