首页 > 解决方案 > 从表中提取数据时,Tesseract 给出错误的结果

问题描述

我想使用 Tesseract 从表中提取文本。文本提取得很好,但我也得到了一些奇怪的输出,我不知道它来自哪里。奇怪的输出从第 9 列开始。正如 Tesseract 开发人员建议的那样,该图像具有 300dpi,我正在使用用于 Tesseract 3.04 的 C# 包装器。我也尝试删除这些线条,但这没有帮助。

我可以做些什么来增强图像以便获得正确的结果?作为参考,这里是图像和输出。

原图:在此处输入图像描述

以下是显示错误结果的部分输出:在此处输入图像描述

谢谢你帮助我

标签: c#tesseract

解决方案


推荐阅读