首页 > 解决方案 > Tesseract:使用长期短期记忆会引发“无法读取立方体语言模型”

问题描述

我正在尝试使用 Tesseract 来识别记录上蚀刻中的文本,例如:

在此处输入图像描述

Tesseract 命令行文档建议可以通过传递 --oem 标志来指定“OCR 引擎模式”。OCR 引擎模式 1 是一种“神经网络 LSTM”,听起来很有希望。但是,当我尝试使用以下命令唤起该模型时:

tesseract etching.png stdout --oem 1

我得到这个堆栈跟踪:

Cube ERROR (CubeRecoContext::Load): unable to read cube language model params from /usr/local/Cellar/tesseract/3.05.01/share/tessdata/eng.cube.lm
Cube ERROR (CubeRecoContext::Create): unable to init CubeRecoContext object
init_cube_objects(false, &tessdata_manager):Error:Assert failed:in file tessedit.cpp, line 210
Abort trap: 6

如果我放下--oem标志,我会得到输出(但这是无稽之谈)。有谁知道如何解释这条消息,或者我可以做些什么来利用 LSTM 模型?我在 OSX...

标签: c++tesseract

解决方案


推荐阅读