c# - 从表中提取数据时,Tesseract 给出错误的结果
问题描述
我想使用 Tesseract 从表中提取文本。文本提取得很好,但我也得到了一些奇怪的输出,我不知道它来自哪里。奇怪的输出从第 9 列开始。正如 Tesseract 开发人员建议的那样,该图像具有 300dpi,我正在使用用于 Tesseract 3.04 的 C# 包装器。我也尝试删除这些线条,但这没有帮助。
我可以做些什么来增强图像以便获得正确的结果?作为参考,这里是图像和输出。
谢谢你帮助我
解决方案
推荐阅读
- sql - 根据条件过滤 DB2 组
- javascript - 如何将 *ngif 用于 [值]?
- html - 什么是标准的 Web SpeechSynthesis 语音?
- kubernetes - 如何使用 Kubernetes 和 Gitlab CI/CD 在 Google Cloud Platform 中部署多个环境?
- php - jquery ui中的对话框不会打开
- javascript - 迭代过程如何工作
- c# - 在 C# 中使用 OAuth 授权代码流请求 access_token 时收到 400 Bad Request?
- javascript - 基于 JSON 文件创建 JSON 对象
- java - Eclipse 将 Maven 运行时范围的依赖项放在类路径上
- sql - 基于多个类别的过滤