首页 > 解决方案 > Tesseract 无法识别明文

问题描述

我正在尝试使用 Tesseract 在某些图像上查找文本,但在处理该图像时遇到了问题:

图像

文字是葡萄牙语,虽然写得很清楚Imagem,但 Tesseract 只给了我ot

我正在使用的命令是tesseract tmp.jpg out --psm 7 -l por,我尝试改变--psm参数但没有运气。

我缺少什么可以提高识别度的东西吗?

标签: ocrtesseract

解决方案


Tesseract 尝试根据图像中的黑色像素来猜测字体大小,因此最好在白色背景上使用黑色文本。


推荐阅读