首页 > 解决方案 > CNN + LSTM + CTC 用于 OCRing 英文单词和字母数字字符

问题描述

我已经为 OCR 训练了一个模型(cnn + lstm + ctc),我观察到它对单词很有效。

例如,我用所有颜色名称(白色、绿色等)以及字母数字字符(如 HLJH9990012、BJGH888902)训练了模型。

现在,每当我必须使用 OCR 或颜色名称时,它都可以很好地处理新数据,但字母数字字符上的 OCR 就不起作用了。

例如,我给出了一个包含字符 JGTR777909 的新图像,但它读取为 H999。

我训练模型时的字符分布是均匀的。

那么 LSTM 只对识别单词有好处吗?为什么它不能识别字母数字字符?

标签: tensorflowlstm

解决方案


推荐阅读