首页 > 解决方案 > 为什么 Tesseract 会因此图像出现“空页”而失败?

问题描述

我有以下屏幕截图:

原始截图

在这种情况下,我想从该图像中提取手稿字数3.574(见下面的红色矩形)。

带有我要 OCR 标记的文本的屏幕截图

为此,我运行以下脚本:

magick screenshot.png -crop 33x20+2+83 screenshot-cropped.png
tesseract screenshot-cropped.png screenshot-ocred -l eng

第一行删掉了字数的地方并保存在screenshot-cropped.png其中,如下所示:

要识别为图像的文本

tesseract screenshot-cropped.png screenshot-ocred -l eng应该识别字符并将它们保存为screenshot-ocred.txt.

但是,它会产生以下错误:

C:\usr\dp\ref\marcomm\2020_04_22_wordCounter>ocr.bat

C:\usr\dp\ref\marcomm\2020_04_22_wordCounter>magick screenshot.png -crop 33x20+2+83 screenshot-cropped.png

C:\usr\dp\ref\marcomm\2020_04_22_wordCounter>tesseract screenshot-cropped.png screenshot-ocred -l eng
Tesseract Open Source OCR Engine v5.0.0-alpha.20200328 with Leptonica
Empty page!!
Empty page!!

我该如何修复它,即让 Tesseract 识别3.574并保存它screenshot-ocred.txt

注意:所有这些都在 Windows 上运行。这是输出magick --version

C:\usr\dp\ref\marcomm\2020_04_22_wordCounter>magick --version
Version: ImageMagick 7.0.10-7 Q16 x64 2020-04-20 http://www.imagemagick.org
Copyright: Copyright (C) 1999-2018 ImageMagick Studio LLC
License: http://www.imagemagick.org/script/license.php
Visual C++: 180040629
Features: Cipher DPC Modules OpenCL OpenMP(2.0)
Delegates (built-in): bzlib cairo flif freetype gslib heic jng jp2 jpeg lcms lqr lzma openexr pangocairo png ps raw rsvg tiff webp xml zlib

标签: ocrtesseract

解决方案


添加--psm 7到 Tesseract 调用解决了问题 ( tesseract screenshot-cropped.png screenshot-ocred -l eng --psm 7)。


推荐阅读