首页 > 解决方案 > RNN/LSTM 可以用于非标准文本 OCR 吗?

问题描述

我读过 LSTM 和 RNN,甚至 CTC。据我了解,RNN 用于计算序列中缺失的标记(例如,句子中的单词)。但是,我的问题是阅读用草书书写的人名。很多名字不受欢迎,无法在语言模型中找到,所以如果 RNN 只是预测缺失的单词,它不会成功,因为我没有可能的人名的完整数据集,对吧?

1)我可以使用RNN来识别非标准词吗?(例如罕见/不受欢迎的人名)

2)如果没有,是否有任何其他替代。? 或者我必须使用传统的 OCR 方法(尝试分割然后分类字符)?

标签: ocrlstmrnnctc

解决方案


由 CNN + RNN + CTC 构建的神经网络在字符级工作。他们学习预测字符串,而不关心单词或底层语言。您当然可以将字典和/或语言模型集成到 CTC 解码器中,但您不必这样做。这样,此类网络只需查看字符即可读取任意人名。有关使用此类神经网络模型进行文本识别的高级介绍,请参阅https://towardsdatascience.com/2326a3487cd5

还有一点需要注意的是:RNN用于沿序列传播信息,例如,根据周围环境确定一个看起来模棱两可的角色可能是什么。


推荐阅读