tesseract - 如何使用 gImageReader 为 Tessearct 创建配置文件?
问题描述
我试图阻止 Tesseract 使用连字(例如,2 个字符中的“fi”仅在一个字符中变为“fi”),并发现可以在引擎配置文件中添加一个参数来做到这一点。
但是我无法在tessdata
我的 gImageReader 安装目录中找到此文件...
如何根据格式、名称和其他潜在的语法要求创建一个?
解决方案
您可能需要解压缩.traineddata
文件以使用以下内容向文件添加条目unicharambigs
,然后重新打包。
1 fi 2 fi 1
推荐阅读
- c# - 使用工厂和构建器模式创建一些类的最佳方法
- android - 颤振系列
构造函数 - pine-script - 为什么这个计算会产生错误的结果?
- c++ - C++ 使用 ostream_iterator 解决 STL 容器的 ostream 运算符<< 重载
- c# - Unity:测试返回 IPromise 的异步函数
- c# - 无法解析类型“Microsoft.AspNetCore.DataProtection.IDataProtector”的服务
- javascript - 将 PHP 变量添加到 new Date()
- c++ - 如何正确添加 const char 类型的变量?
- android - 是否可以使用 MockK 监视暂停 Android Room DAO 功能
- python - Tkinter 中的垂直滚动条