tensorflow - CNN + LSTM + CTC 用于 OCRing 英文单词和字母数字字符
问题描述
我已经为 OCR 训练了一个模型(cnn + lstm + ctc),我观察到它对单词很有效。
例如,我用所有颜色名称(白色、绿色等)以及字母数字字符(如 HLJH9990012、BJGH888902)训练了模型。
现在,每当我必须使用 OCR 或颜色名称时,它都可以很好地处理新数据,但字母数字字符上的 OCR 就不起作用了。
例如,我给出了一个包含字符 JGTR777909 的新图像,但它读取为 H999。
我训练模型时的字符分布是均匀的。
那么 LSTM 只对识别单词有好处吗?为什么它不能识别字母数字字符?
解决方案
推荐阅读
- r - igraph 基于属性的相邻边
- laravel - Laravel 5.5 在控制器中连接你的类
- python - 用泡菜或莳萝保存类数据不起作用
- powershell - 在企业应用程序上分配应用程序角色所需的 AzureAD 目录角色是什么?
- python - 是否有另一种方法可以将相同的 for 字典循环迭代为无限?
- c++ - 打印指针向量的值
- javascript - 在 JS 文件中动态加载 React 组件
- sql-server - 带有数据库项目的 EF Core 工作流
- java - OpenGL绘图三角形不显示+ glClearColor不设置屏幕颜色
- sparql - 如何指定属性的“任何”值?