首页 > 解决方案 > 使用 PDFJS 从 pdf 中提取文本 (2018)

问题描述

我发现用于使用 PDFJS 提取文本的早期版本的代码不再适用于最新版本的 PDFJS。以下是一些以前的版本

使用javascript从pdf文件中提取文本

如何使用 pdf.js 从 pdf 中正确提取文本

在 Javascript 中从 pdf 中提取文本

有没有人有当前有效的代码?

标签: javascriptpdfjs

解决方案


迭代 getTextContent() 的返回值。

pdfDoc.getPage(1).then((p) => {
p.getTextContent().then((textContent) => {
// Iterate here
});
});

推荐阅读