ocr - Tesseract 即使在普通图像上也会产生可怕的结果
问题描述
我一直在涉足 tesseract 并在一个带有白色背景的简单图像和使用 PHP 创建的简单字符串上对其进行测试。但是,我得到的几乎所有结果都是错误的。从下图中,我得到的结果是“Q Oo 86 E” 阅读时有什么我不知道的吗?还是我应该选择更好的字体?
解决方案
Upscaling image and sharpening it helps.
image = cv2.imread('image.png', cv2.IMREAD_GRAYSCALE)
image = cv2.resize(image, (800, 200)) #upscale
image = cv2.filter2D(image, -1, np.array([-1,4,-1])) #sharpen
print(pytesseract.image_to_string(image, config='--psm 7')) #use psm 7 since it is a single line
result:
I Q Q 8 E W
推荐阅读
- c# - 复制函数
- python - python,记录器,文件结构,全局配置
- function - 如何从多行中读取字符串并分别打印出来?
- python - init 需要 1 个参数,但给出了 2 个参数?(定位)
- python - Django为外键字段分配或保存值
- java - Spring Boot 安全性 | 为什么我的 authenticationManager 不起作用?
- python - 在 if 语句中使用 tqdm 进度条
- jquery - 带有重叠框的 mouseenter(或 mouseover)
- touch - Fabricjs touch:手势事件在触摸屏上不起作用
- visual-studio-code - Visual Studio Code SASS 编译器