java - Tess-TessBaseAPI 未检测到图像中的所有字符
问题描述
我是使用 Tesseract 的新手,这是我第一次尝试 OCR。
我正在尝试检测下图中的所有字符行,每一行都是一个单词:
我正在运行以下代码来尝试获取文本:
baseAPI.setImage(bitmap);
String charsFromImage = baseAPI.getUTF8Text();
但是,我得到的输出是:
LGQTKCELASELOHW
ZVCGCNUYRNNL
H
LKBK
OVPSMIMEETNGL
J
W
A
C
VNTZRRTMKEBR
LGRTTL
E Y
RSTSWOOL
CRRSRDMRRRRD
HMQOQUENKAGPPQDE
LDPD
TCQLDCRRMZAE
FNECTMFKCLMRRRL
N
TORRO
LPAHNQMHS
ENAUCOMPET
FYCMH
EQCF
L
M
LMTRVI E
L
L
BNPNRRTCPL
L J
E
ATERZADWZAZA
GTURNOVERNCKMDSH
TXMKS
ATNEMTSEVN
即使这是一个清晰的图像,它也不能正确返回。
任何帮助,将不胜感激!
解决方案
嗯,尝试使用“稀疏文本”页面分割模式:baseAPI.setPageSegMode(PSM_SPARSE_TEXT);
.
推荐阅读
- reactjs - 如何将函数传递给不同的组件反应
- python - Python timedelta 结果为整数
- html - 如何使用 onkeypress 在 HTML 中移动图像
- go - 接收加密/rsa:解密文件时出现解密错误
- audio - Ambisonic 录音和 RealityKit
- c# - 如何在 Server 2019 Datacenter 上重新启动 Windows 服务?
- python - 检查 val_acc 饱和度的回调
- python - 如何解决安装Tensorflow的错误?
- javascript - Node.js JsonParser 自定义函数“无法读取未定义的属性”
- javascript - 如何知道选定的 div ?角