首页 > 解决方案 > Tesseract 即使在普通图像上也会产生可怕的结果

问题描述

我一直在涉足 tesseract 并在一个带有白色背景的简单图像和使用 PHP 创建的简单字符串上对其进行测试。但是,我得到的几乎所有结果都是错误的。从下图中,我得到的结果是“Q Oo 86 E” 阅读时有什么我不知道的吗?还是我应该选择更好的字体? 试图读取的图像

标签: ocrtesseractpython-tesseract

解决方案


Upscaling image and sharpening it helps.

image = cv2.imread('image.png', cv2.IMREAD_GRAYSCALE)
image = cv2.resize(image, (800, 200)) #upscale
image = cv2.filter2D(image, -1, np.array([-1,4,-1])) #sharpen
print(pytesseract.image_to_string(image, config='--psm 7')) #use psm 7 since it is a single line

result:

I Q Q 8 E W


推荐阅读