pdf - Ghostscript:转换 pdf 使得每一页都是一个没有单个对象/文本的图像
问题描述
我想转换带有图像和文本的多页 pdf,这样每个页面都只是一个平面图像,没有可以选择的单个对象/文本(需要不要弄乱 pdf--> ppt 转换......)。无法搜索/复制文本是不够的(我试过了-dNoOutputFonts
)。此命令对某些包含图像的页面执行我想要的操作,但对于其他主要包含文本的页面则不行(这似乎-dHaveTransparency=false
是关键):
gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -dPDFSETTINGS=/printer -dCompatibilityLevel=1.5 -dHaveTransparency=false -dFastWebView=true -sOutputFile=out_file.pdf in_file.pdf
为所有页面获取此行为的神奇设置是什么?(理想情况下,同时保持高质量的输出并且不会过度增加文件大小;-))
解决方案
我刚刚尝试了一个效果很好的实验,可能是你想要的:
gs -sDEVICE=pdfimage8 -r600 -dNOPAUSE -sOutputFile=output.pdf input.pdf
根据需要尝试 pdfimage24 和 pdfimage32 设备。这里有更多信息:https ://www.ghostscript.com/doc/9.53.3/Devices.htm#PDFimage
推荐阅读
- git - 查找合并提交的源分支
- c# - 通过 System.Reflection 动态连接 System.DirectoryServices
- javascript - 调用 onchange 文本时如何更新对象数组中的值(在平面列表中)
- flutter - 容器尺寸限制仅适用于脚手架
- c# - 按大小升序/降序对文件进行排序
- google-people-api - 将 GoogleContactEntry 的“id”转换为“resourceName”到 Person
- javascript - laravel刀片组件和vue组件有什么区别?
- flutter - 获取 Wordpress 文章并将其放入 Flutter Story 应用程序
- c# - C# 使用泛型、反射和类型推断
- android - 保留所有字符串 JNI android 以防止逆向工程?