首页 > 解决方案 > 将任何版本的 PDF 转换为扫描/展平 PDF 文件的最佳方法

问题描述

我想知道有没有一种方法可以帮助我将未扫描的 PDF(可以在 Acrobat Pro 中修改)转换为扫描/拼合的文件(不能在 Acrobat Pro 中编辑)。

我一直在使用 FPDF 库,但它似乎无法识别 PDF 是否被展平/不在第一位,并且取决于此它触发了一些不同的操作。

我已尽力研究 FPDF 库,我认为它会检查“外部参照”位置并决定采取哪些步骤。但在我的情况下,我有 2 个文件,一个是扁平的,一个不是,FPDF 无法确定差异本身。这两个文件都是 1.4 版。我还读到 FPDF 对处理只有 1.4 版本的 pdf 有限制。

标签: phpfpdfghostscript

解决方案


您可以使用 Ghostscript 的 pdfimage 设备,它将整个内容呈现为图像,然后将其包装为 PDF 文件。如果不通过 OCR 软件运行,绝对不可能从中提取任何东西。这“听起来是谎言”是你想要的,尽管很难确定。

恐怕我认为您对“扁平化”的理解是不正确的。所有 PDF 文件都会有一个外部参照,因此无论您的用户/经理使用这个相当模糊的术语是什么意思,是否存在这样的关键字都不会告诉您 PDF 是否“扁平化”。

缺少“外部参照”可能意味着该文件是 PDF 1.5 或更高版本,并且正在使用压缩的外部参照。与它被展平无关,但任何 PDF 用户都必须将此类文件与 PDF 1.4 或以下文件区别对待。


推荐阅读