google-vision - Google Vision Api 文本检测换行符
问题描述
当我阅读带有文本的图像时,Google Vision 会在句子中间插入换行符。我该怎么做才能避免这种情况。以下是图片文本和 Google Vision 返回的示例:
图片中的文字:
01 600149 CHICKEN M PR 1 UN X 3.500 (0.11)
02 600019 POTATO M PR 1 UN X 7.50 (0.24)
03 31820 COCA ZERO M PR 1 UN X 10.90 (0.00)
谷歌视觉回报:
01 600149 CHICKEN M PR
02 600019 POTATO M PR
03 31820 COCA ZERO M PR
1 UN X 3,500 0.11)
1 UN X 7.50 (0.24)
1 UN X 10.90 (0.00)
谢谢,
解决方案
您无法真正控制 Google 如何检测文本框。它们不是同一行,因为它们的文本检测器分别检测到不同的文本框(可能是为了更好的 OCR 质量)
您可以做的是检查每个文本框的 y 位置(在 OCR 的结果中给出),如果 y 接近,则将文本放在一起。当然,您应该通过升序 x 来排序,以便您的文本处于良好的顺序。
推荐阅读
- css - weasyprint 没有正确渲染 bootstrap4 css
- javascript - Firebase使用javascript中的变量更新字段
- python - 从 CSV 文件中,连续计算唯一值并使用 python 打印总数
- c++ - 我可以使用 CMake 包含和链接库的最简单方法是什么?
- react-native - 将道具传递到顶部导航的所有屏幕
- laravel - 当我尝试使用 laravel 发送电子邮件时,我不断收到以下错误
- gatsby - Gatsby 站点的自动部署
- javascript - 如何部署从命令行运行的 Javascript 应用程序?
- machine-learning - ValueError:名称“Sequential”在模型中使用了 4 次。所有图层名称都应该是唯一的?
- c++ - 无需外部库的简单结构的序列化