首页 > 解决方案 > imagemagick 将带有文本(无扫描)的 pdf 转换为乱码

问题描述

我正在用 imagemagick 处理 pdf 文件到图像,但是这个特定的文件被处理成一些非常乱的东西为了简化我正在做的简单的事情

convert file.pdf out.jpg

只是一个想法是它是文本 pdf 和图像 pdf 的混合,这可能会导致麻烦。你能帮我吗?文本中的文档页面被转换为这种乱码,实际扫描的最后一页很好 在此处输入图像描述

这是原始 文件的链接

编辑:我发现没有文本和扫描组合的文件也会导致问题,实际上是包含文本数据的文件,而不是扫描的图像。所以问题是如何设置 imagemagick 将带有纯文本的 pdf 转换为图像而不得到这个输出

标签: imagemagickimagemagick-convert

解决方案


问题出在 ghostscript 9.22,更新到 9.23 有帮助


推荐阅读