首页 > 解决方案 > Tesseract 强制空间和字符替换

问题描述

我正在对图像文件进行 tesseract 转换。这是用于从图像中提取文本的代码:

#Extract text from Image 
im = Image.open(r"C:\Users\XXXXX")
text = pytesseract.image_to_string(im, lang = 'eng',config='--psm 1 --oem 3')
print(text)

但是在执行此操作时,我在输出中遇到了一些错误。一些例子是空间损失和错误转换。

 I am -> Iam
 I -> | 

您能否建议如何纠正这些错误?

要转换为文本的图像

标签: pythonimagetextpython-tesseractfile-conversion

解决方案


推荐阅读