imagemagick - imagemagick - 将细节限制在图像的某个区域
问题描述
我需要处理大量点阵打印文档的扫描,以便优化它们以使用 ocr 引擎读取。我使用 imagemagick 来确保矩阵的点之间没有空白,因此 ocr 引擎工作得更好。问题在于性能,pdf 以 600dpi 扫描,处理时间太长。我想将处理限制在受区域 ocr 影响的区域,我尝试使用“-region”运算符,但即使它有效,处理也需要相同的时间。这是 windows 命令行使用的命令:
convert -density "601.6x600" -units pixelsperinch -monochrome files\1.pdf -region 2000x200+2500+2100 -negate -morphology Thinning "17x17+8+8: -,-,-,-,-,0,0,0,0,0,0,0,-,-,-,-,- -,-,-,-,0,0,0,0,0,0,0,0,0,-,-,-,- -,-,-,0,0,0,0,0,0,0,0,0,0,0,-,-,- -,-,0,0,0,0,-,-,-,-,-,0,0,0,0,-,- -,0,0,0,0,-,-,-,-,-,-,-,0,0,0,0,- 0,0,0,0,-,-,-,-,-,-,-,-,-,0,0,0,0 0,0,0,-,-,-,-,-,-,-,-,-,-,-,0,0,0 0,0,0,-,-,-,-,-,-,-,-,-,-,-,0,0,0 0,0,0,-,-,-,-,-,1,-,-,-,-,-,0,0,0 0,0,0,-,-,-,-,-,-,-,-,-,-,-,0,0,0 0,0,0,-,-,-,-,-,-,-,-,-,-,-,0,0,0 0,0,0,0,-,-,-,-,-,-,-,-,-,0,0,0,0 -,0,0,0,0,-,-,-,-,-,-,-,0,0,0,0,- -,-,0,0,0,0,-,-,-,-,-,0,0,0,0,-,- -,-,-,0,0,0,0,0,0,0,0,0,0,0,-,-,- -,-,-,-,0,0,0,0,0,0,0,0,0,-,-,-,- -,-,-,-,-,0,0,0,0,0,0,0,-,-,-,-,-" -morphology Thinning "13x13+6+6: -,-,0,0,0,0,0,0,0,0,0,-,- -,0,0,0,0,0,0,0,0,0,0,0,- 0,0,0,-,-,-,-,-,-,-,0,0,0 0,0,-,-,-,-,-,-,-,-,-,0,0 0,0,-,-,-,-,-,-,-,-,-,0,0 0,0,-,-,-,-,-,-,-,-,-,0,0 0,0,-,-,-,-,1,-,-,-,-,0,0 0,0,-,-,-,-,-,-,-,-,-,0,0 0,0,-,-,-,-,-,-,-,-,-,0,0 0,0,-,-,-,-,-,-,-,-,-,0,0 0,0,0,-,-,-,-,-,-,-,0,0,0 -,0,0,0,0,0,0,0,0,0,0,0,- -,-,0,0,0,0,0,0,0,0,0,-,-" -morphology Close Disk -negate -compress zip r.pdf
PS我想在imagemagick论坛上发帖,但是我没有找到订阅链接...
解决方案
问题在这里解决了https://github.com/ImageMagick/ImageMagick/discussions/2841。
-region 参数似乎在处理整个文件后起作用。使用克隆、裁剪、图层和展平修复:
magick in.tiff ( +clone -crop 100x100+500+500 -morphology dilate disk ) -layers flatten x2.tiff
推荐阅读
- javascript - 无法在一个评级 div 上重置 Jquery Raty 的显示
- python - Python Regex 匹配除以标签开头的单词之外的所有内容
- node.js - 无法读取 dynamodb 客户端的 aws-sdk js v3 未定义的属性“byteLength”
- python - 如何通过向交叉熵添加负熵来创建自定义损失函数?
- discord.js - Discord.js 如何让收集器把东西改成大写
- java - 使用 Java 运行位于 NAS 卷上的批处理文件
- javascript - 如何在后端渲染 svg 并使用 d3 在节点 js 中保存到本地?
- spring-security-oauth2 - Spring Security Oauth2 AuthenticationSuccessEvent 未为 grant_type 'refresh_token' 发布
- flutter - flutter_map 参数 'source' 是必需的
- sql - 拆分后的 Microsoft Access 不再能够输入值?