首页 > 解决方案 > 使用 Ghost 脚本将 PDF 转换为 PNG - 裁剪到页面的顶部三分之一

问题描述

我正在尝试将 PDF 文件转换为图像,并在此过程中裁剪到第一页顶部的前三分之一(大约)。

这个命令给了我整个页面,如果我使值变小,则将 -g 选项裁剪到左下角。

对于 (*) 中的 %%x,请执行 "......\program\gs\gs9.23\bin\gswin32c.exe" -g2500x3300 -dFIXEDMEDIA -dMaxBitmap=500000000 -dAlignToPixels=0 -dGridFitTT=2 -sDEVICE= pngalpha -dTextAlphaBits=4 -dGraphicsAlphaBits=4 -r300x300 -dBATCH -dNOPAUSE -dFirstPage=1 -dLastPage=1 -SOutputFile="%%~nx.png" "%%~nx.pdf"

我想要较小的图像,以便图像上的 OCR 更快,并且我正在处理的大多数字母/文档的信息都位于前三分之一。

标签: pngcropghostscript

解决方案


PostScript 页面(和 PDF 页面)的原点 (0, 0) 位于左下方。因此,通过减小媒体大小,您可以使内容的最上部远离媒体,因此不会被渲染。

所以你需要做的是减小媒体的大小(你已经做了)**和*翻译原点,使内容的顶部位于媒体上。

尝试在输入 PDF 文件之前添加 -c "<< /BeginPage {-300 0 translate} >> setpagedevice" -f。这应该将原点转换为 300 dpi 下媒体底部下方 1 英寸,这应该使页面顶部多 1 英寸,页面底部少 1 英寸。

显然由于我不知道你的内容有多大,所以我不能给你一个确切的答案。


推荐阅读