python - Tesseract-OCR 无法识别数字
问题描述
我使用 Tesseract OCR 来识别下面的图片(它是一个电动图像计),但它不起作用。我不允许使用机器学习或深度学习。有没有人可以使用其他一些技术来解决我的问题?请给我一个指导。感谢您的阅读。
这是我的代码:
import cv2
import pytesseract as pts
pts.pytesseract.tesseract_cmd = r'C:\Users\Thep Ho\AppData\Local\Programs\Tesseract-OCR\tesseract.exe'
img = cv2.imread("images/text1.jpg")
text = pts.image_to_string(img)
print(text)
解决方案
- 如果应用于
adaptive-thresholding
输入图像:
代码:
import re
import cv2
import pytesseract
img = cv2.imread("Eadxj.png")
gry = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
flt = cv2.adaptiveThreshold(gry,
252, cv2.ADAPTIVE_THRESH_MEAN_C,
cv2.THRESH_BINARY_INV, 31, 7)
txt = pytesseract.image_to_string(flt)
txt_int = re.sub("[^0-9]", "", txt)
print(txt_int)
但如果你被允许使用deep-learning
,结果将是:
推荐阅读
- excel - 一旦我确定 Excel 安装在 Windows 上,我如何以编程方式判断它是否是使用 vb.net 或 C# 的许可/注册副本
- deployment - 如何限制 RStudio Connect ShinyR 应用程序的部署环境?
- apache-spark - Spark SQL 结果与 Hive SQL 结果不同
- r - seqformat 在 R 中创建具有 NA 值的序列
- docker - 在 docker-compose up 中出现“服务错误”
- preg-match-all - preg_match_all 未完成字符串匹配
- c# - 升级到 .Net 5 后表架构不起作用
- python - Python 无法连接到 HTTPS URL,因为 SSL 模块不可用 HTTPSConnectionPool(url, port=443)
- javascript - 单击按钮启动功能时,HTML JavaScript 弹出框不起作用
- r - 从使用 ggcoefstats 绘图中删除 beta 系数