首页 > 解决方案 > Tess-TessBaseAPI 未检测到图像中的所有字符

问题描述

我是使用 Tesseract 的新手,这是我第一次尝试 OCR。

我正在尝试检测下图中的所有字符行,每一行都是一个单词:

词搜索

我正在运行以下代码来尝试获取文本:

 baseAPI.setImage(bitmap);
 String charsFromImage = baseAPI.getUTF8Text();

但是,我得到的输出是:

LGQTKCELASELOHW

ZVCGCNUYRNNL

H

LKBK

OVPSMIMEETNGL

J

W

A

C

VNTZRRTMKEBR

LGRTTL

E Y

RSTSWOOL

CRRSRDMRRRRD

HMQOQUENKAGPPQDE

LDPD

TCQLDCRRMZAE

FNECTMFKCLMRRRL

N

TORRO

LPAHNQMHS

ENAUCOMPET

FYCMH

EQCF

L

M

LMTRVI E

L

L

BNPNRRTCPL

L J

E

ATERZADWZAZA

GTURNOVERNCKMDSH

TXMKS

ATNEMTSEVN

即使这是一个清晰的图像,它也不能正确返回。

任何帮助,将不胜感激!

标签: javatesseracttess-two

解决方案


嗯,尝试使用“稀疏文本”页面分割模式:baseAPI.setPageSegMode(PSM_SPARSE_TEXT);.


推荐阅读