c++ - Tesseract:使用长期短期记忆会引发“无法读取立方体语言模型”
问题描述
我正在尝试使用 Tesseract 来识别记录上蚀刻中的文本,例如:
Tesseract 命令行文档建议可以通过传递 --oem 标志来指定“OCR 引擎模式”。OCR 引擎模式 1 是一种“神经网络 LSTM”,听起来很有希望。但是,当我尝试使用以下命令唤起该模型时:
tesseract etching.png stdout --oem 1
我得到这个堆栈跟踪:
Cube ERROR (CubeRecoContext::Load): unable to read cube language model params from /usr/local/Cellar/tesseract/3.05.01/share/tessdata/eng.cube.lm
Cube ERROR (CubeRecoContext::Create): unable to init CubeRecoContext object
init_cube_objects(false, &tessdata_manager):Error:Assert failed:in file tessedit.cpp, line 210
Abort trap: 6
如果我放下--oem
标志,我会得到输出(但这是无稽之谈)。有谁知道如何解释这条消息,或者我可以做些什么来利用 LSTM 模型?我在 OSX...
解决方案
推荐阅读
- azure - 有没有办法在发布管理中使用相同的应用服务部署多个项目?
- angular - Angular - 需要在导出类的内部/外部定义哪些变量?
- html - 使用引导程序如何并排排列两个文本框
- tensorflow - tensorflow的会话运行接口是可重入的吗?
- c# - 如何使 WT41N0 扫描仪不扫描条形码或将回车符传递给 C# 中的 messageBox
- json - ReactJS - 为什么删除数组重复项的功能会导致下拉列表出现故障
- libgdx - Libgdx 处理 Sprite 批处理错误
- javascript - 仅在桌面版本上使 js 代码异步
- angular - 在字符串Angular中使用for循环索引
- c++ - 未编译所有数据