首页 > 技术文章 > Tesseract OCR win 32位编译

cheungxiongwei 原文

https://github.com/tesseract-ocr/tesseract/wiki/Compiling

找到该标题:Develop Tesseract
按照上面的步骤执行即可,最后使用  vs2015 打开  sln 工程文件,编译。

编译过程中,会报一些错,把报错的文件编码格式更改 gbk 的即可。


然后下载数据文件
https://github.com/tesseract-ocr/tesseract/wiki/Data-Files
这里就下载英文和中文,
eng.traineddata
chi_sim.traineddata

使用命令行工具测试控制台程序是否运行正常

tesseract.exe 图片路径 结果保存路径 语言设置
例子:
tesseract.exe c:img200W.jpg c:
esult.txt -l eng+chi_sim

推荐阅读