首页 > 解决方案 > Ghostscript:转换 pdf 使得每一页都是一个没有单个对象/文本的图像

问题描述

我想转换带有图像和文本的多页 pdf,这样每个页面都只是一个平面图像,没有可以选择的单个对象/文本(需要不要弄乱 pdf--> ppt 转换......)。无法搜索/复制文本是不够的(我试过了-dNoOutputFonts)。此命令对某些包含图像的页面执行我想要的操作,但对于其他主要包含文本的页面则不行(这似乎-dHaveTransparency=false是关键):

gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -dPDFSETTINGS=/printer -dCompatibilityLevel=1.5 -dHaveTransparency=false -dFastWebView=true -sOutputFile=out_file.pdf in_file.pdf

为所有页面获取此行为的神奇设置是什么?(理想情况下,同时保持高质量的输出并且不会过度增加文件大小;-))

标签: pdfghostscript

解决方案


我刚刚尝试了一个效果很好的实验,可能是你想要的:

gs -sDEVICE=pdfimage8 -r600 -dNOPAUSE -sOutputFile=output.pdf input.pdf

根据需要尝试 pdfimage24 和 pdfimage32 设备。这里有更多信息:https ://www.ghostscript.com/doc/9.53.3/Devices.htm#PDFimage


推荐阅读