ocr - 使用 Tesseract 检测文本中的图像(图片)
问题描述
我正在使用 Tesseract C API 来扫描文档。我能够以高精度扫描文档。但有些文件有图片(图像)。Tesseract 是否支持检测文档中的图像?我已经通过 Tesseract API 并没有找到任何 API。即使 Tesseract 为文档中的图像提供了一个边界框,这也会很有帮助。我可以从原始文档中裁剪图像并丢弃该边界框中由 Tesseract 进行的任何文本 OCRed。
谢谢。
解决方案
推荐阅读
- powershell - 为什么“调用命令”没有采取任何措施? - 电源外壳
- apache-kafka - Kafka Transaction 以防多线程
- c# - CsvHelper 的 Filestream 和 datagridview 内存问题
- react-native - 如何将本机模块作为依赖项集成到自定义模块/库中以响应本机
- python - open(..., encoding="") vs str.encode(encoding="")
- mysql - MySQL 表中的日期时间值不正确
- amazon-web-services - aws 如何从生产环境中的 lambda 函数访问 ECS 服务
- shell - 合并文件的两行
- c# - 列表在循环和 switch 语句中被覆盖
- git - git-ls-files 中 --others 和 --other 之间的区别