首页 > 解决方案 > 如何使用 gImageReader 为 Tessearct 创建配置文件?

问题描述

我试图阻止 Tesseract 使用连字(例如,2 个字符中的“fi”仅在一个字符中变为“fi”),并发现可以在引擎配置文件中添加一个参数来做到这一点

但是我无法在tessdata我的 gImageReader 安装目录中找到此文件...

如何根据格式、名称和其他潜在的语法要求创建一个?

标签: tesseract

解决方案


您可能需要解压缩.traineddata文件以使用以下内容向文件添加条目unicharambigs,然后重新打包。

1 fi 2 fi 1

请参阅文档:https ://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract-3.03%E2%80%933.05#the-unicharambigs-file


推荐阅读