ocr - RNN/LSTM 可以用于非标准文本 OCR 吗?
问题描述
我读过 LSTM 和 RNN,甚至 CTC。据我了解,RNN 用于计算序列中缺失的标记(例如,句子中的单词)。但是,我的问题是阅读用草书书写的人名。很多名字不受欢迎,无法在语言模型中找到,所以如果 RNN 只是预测缺失的单词,它不会成功,因为我没有可能的人名的完整数据集,对吧?
1)我可以使用RNN来识别非标准词吗?(例如罕见/不受欢迎的人名)
2)如果没有,是否有任何其他替代。? 或者我必须使用传统的 OCR 方法(尝试分割然后分类字符)?
解决方案
由 CNN + RNN + CTC 构建的神经网络在字符级工作。他们学习预测字符串,而不关心单词或底层语言。您当然可以将字典和/或语言模型集成到 CTC 解码器中,但您不必这样做。这样,此类网络只需查看字符即可读取任意人名。有关使用此类神经网络模型进行文本识别的高级介绍,请参阅https://towardsdatascience.com/2326a3487cd5
还有一点需要注意的是:RNN用于沿序列传播信息,例如,根据周围环境确定一个看起来模棱两可的角色可能是什么。
推荐阅读
- flutter - Flutter Redux 和 Hook。如何观察 useEffect 中的变量实例变化,如反应?
- google-colaboratory - 为什么我无法在 Colab 中挂载到我的 Google 云端硬盘?
- bit-manipulation - 在 Solidity 中将 uint24 转换为 HEX 字符串
- c++ - 使用递归打印的链接列表问题
- javascript - Div 元素从下到上打开,具有滑动效果,而不是从上到下
- react-native - 首次运行应用程序时的 Expo 问题
- c# - 无法在 .net 中将事件添加到 IPC
- powerbi - 无法从 Power BI 服务下载数据集
- excel - (VBA) (Excel) 获取并计算列中的唯一值
- java - 如何使用 RestTemplate 交换获取数据?