首页 > 解决方案 > Google Vision Api 文本检测换行符

问题描述

当我阅读带有文本的图像时,Google Vision 会在句子中间插入换行符。我该怎么做才能避免这种情况。以下是图片文本和 Google Vision 返回的示例:

图片中的文字:

01 600149 CHICKEN M PR 1 UN X 3.500 (0.11)
02 600019 POTATO M PR 1 UN X 7.50 (0.24)
03 31820 COCA ZERO M PR 1 UN X 10.90 (0.00)

谷歌视觉回报:

01 600149 CHICKEN M PR
02 600019 POTATO M PR
03 31820 COCA ZERO M PR
1 UN X 3,500 0.11)
1 UN X 7.50 (0.24)
1 UN X 10.90 (0.00)

谢谢,

标签: google-vision

解决方案


您无法真正控制 Google 如何检测文本框。它们不是同一行,因为它们的文本检测器分别检测到不同的文本框(可能是为了更好的 OCR 质量)

您可以做的是检查每个文本框的 y 位置(在 OCR 的结果中给出),如果 y 接近,则将文本放在一起。当然,您应该通过升序 x 来排序,以便您的文本处于良好的顺序。


推荐阅读