javascript - 使用 PDFJS 从 pdf 中提取文本 (2018)
问题描述
我发现用于使用 PDFJS 提取文本的早期版本的代码不再适用于最新版本的 PDFJS。以下是一些以前的版本
有没有人有当前有效的代码?
解决方案
迭代 getTextContent() 的返回值。
pdfDoc.getPage(1).then((p) => {
p.getTextContent().then((textContent) => {
// Iterate here
});
});
推荐阅读
- python - GMT 时间戳的固定偏移规范
- r - 为 R 安装 TensorFlow 时遇到问题
- dart - 如何为 FAB 设置动作(AngularDart 5、Dart 2)
- android - Firebase Analytics:在控制台中显示“值”参数的平均值和时间平均值,例如从 Android 应用发送的事件的“hh:mm:ss”
- pandas - 如何在月度数据中向 Pandas 添加缺失数据
- jquery - 用 css 和 svg 绘制区块链
- windows - Powershell - 在特定时间后关闭 Out-GridView
- html - VBA在IE中单击登录按钮
- python - Numpy 3D 数组乘以 2D 数组
- angularjs - 从 Angular1 迁移到 Angular5(并行运行)