imagemagick - imagemagick 将带有文本(无扫描)的 pdf 转换为乱码
问题描述
我正在用 imagemagick 处理 pdf 文件到图像,但是这个特定的文件被处理成一些非常乱的东西为了简化我正在做的简单的事情
convert file.pdf out.jpg
只是一个想法是它是文本 pdf 和图像 pdf 的混合,这可能会导致麻烦。你能帮我吗?文本中的文档页面被转换为这种乱码,实际扫描的最后一页很好
这是原始 文件的链接
编辑:我发现没有文本和扫描组合的文件也会导致问题,实际上是包含文本数据的文件,而不是扫描的图像。所以问题是如何设置 imagemagick 将带有纯文本的 pdf 转换为图像而不得到这个输出
解决方案
问题出在 ghostscript 9.22,更新到 9.23 有帮助
推荐阅读
- python - 如何在另一行中创建具有相同值的行的元组列表
- reactjs - 导入 useState 时出错(_typeof 不是函数)
- python - 如何循环添加每个列表项并将它们放在一起?
- html - 使用 jQuery 提交 Ajax 表单
- kotlin-multiplatform - 使用字符串作为 id
- python - 根据python中的条件将列表元素转换为1和0
- scala - 在 Spark/Scala 中使用 date_format 将时间戳转换为星期几字符串
- google-apps-script - GAS 显示“我们很抱歉,从存储读取时发生服务器错误。错误代码 NOT_FOUND。' 当我尝试部署
- kubernetes - 为什么 kubectl exec 需要--?
- nlp - 如何从相似的句子中将自定义意图和实体提取为通用格式?