png - 使用 Ghost 脚本将 PDF 转换为 PNG - 裁剪到页面的顶部三分之一
问题描述
我正在尝试将 PDF 文件转换为图像,并在此过程中裁剪到第一页顶部的前三分之一(大约)。
这个命令给了我整个页面,如果我使值变小,则将 -g 选项裁剪到左下角。
对于 (*) 中的 %%x,请执行 "......\program\gs\gs9.23\bin\gswin32c.exe" -g2500x3300 -dFIXEDMEDIA -dMaxBitmap=500000000 -dAlignToPixels=0 -dGridFitTT=2 -sDEVICE= pngalpha -dTextAlphaBits=4 -dGraphicsAlphaBits=4 -r300x300 -dBATCH -dNOPAUSE -dFirstPage=1 -dLastPage=1 -SOutputFile="%%~nx.png" "%%~nx.pdf"
我想要较小的图像,以便图像上的 OCR 更快,并且我正在处理的大多数字母/文档的信息都位于前三分之一。
解决方案
PostScript 页面(和 PDF 页面)的原点 (0, 0) 位于左下方。因此,通过减小媒体大小,您可以使内容的最上部远离媒体,因此不会被渲染。
所以你需要做的是减小媒体的大小(你已经做了)**和*翻译原点,使内容的顶部位于媒体上。
尝试在输入 PDF 文件之前添加 -c "<< /BeginPage {-300 0 translate} >> setpagedevice" -f。这应该将原点转换为 300 dpi 下媒体底部下方 1 英寸,这应该使页面顶部多 1 英寸,页面底部少 1 英寸。
显然由于我不知道你的内容有多大,所以我不能给你一个确切的答案。
推荐阅读
- python-3.x - 如何让我的 python 程序编写一个新文件
- python-3.x - 获取文件而不保存它 aiohttp discord.py
- javascript - 在谷歌地图上插入多个标记
- azure - Azure AD JWT 令牌中缺少应用程序权限范围
- azure-cosmosdb - CosmosDb Graph:将节点(及其边缘)移动到不同的分区?
- javascript - 在 babylon.js 渲染之前创建网格
- python - 用于鸡尾酒配方生成的条件变分自动编码器
- plsql - sysdate 出错且无法编译
- embedded - 找不到 lpc1768 特定的 FreeRTOS-Plus 库
- python - 在非阻塞文件描述符上使用 select.poll()