python - Tesseract 强制空间和字符替换
问题描述
我正在对图像文件进行 tesseract 转换。这是用于从图像中提取文本的代码:
#Extract text from Image
im = Image.open(r"C:\Users\XXXXX")
text = pytesseract.image_to_string(im, lang = 'eng',config='--psm 1 --oem 3')
print(text)
但是在执行此操作时,我在输出中遇到了一些错误。一些例子是空间损失和错误转换。
I am -> Iam
I -> |
您能否建议如何纠正这些错误?
解决方案
推荐阅读
- c - 如何正确地将 C 结构写入磁盘上的文件,以便可以在其上使用 mmap?
- tree - 红黑树简单应用
- python - 多任务库文档
- python - 爬取网站时收集不同的属性
- asp.net-core - 找不到网页.net core 2.1
- python - scaler.inverse_transform() 在将 LSTM NN 预测转换为实际数据值时出错
- angular - 如何以角度模拟 rxjs/Websocket 以进行单元测试
- linux - 如何在bash中覆盖以前的输出
- xml - 是否可以使用 xmlstarlet 将计算属性(即非常量)插入 XML 文件?
- javascript - 使用 express.js,图像快速加载的最佳方式是什么?