首页 > 解决方案 > 是否可以使用 Puppeteer 将 PDF 转换为 HTML?

问题描述

我知道这可能是另一种方式(HTML 到 PDF),但它可以用另一种方式完成吗?

我没有找到任何有关此的文档。

标签: htmlnode.jspdfpuppeteerheadless-browser

解决方案


不,Puppeteer 不能用于将 PDF 转换为 HTML。根据其网站:

Puppeteer 是一个 Node 库,它提供了一个高级 API 来通过 DevTools 协议控制 Chrome 或 Chromium。

也就是说,Puppeteer 是一个无头 Chrome。由于 Chrome 无法将 PDF 转换为 HTML(如果我错了请纠正我),Puppeteer 也不能。

但是,您可以使用其他 npm 模块,例如pdf-parse来解析 PDF 的文本内容,并自己生成 HTML。或者,直接使用pdf2html等 npm 模块转换 pdf 即可。


推荐阅读