首页 > 解决方案 > Google vision 无法识别表格中的数字

问题描述

我的目标是使用 Google 的 Vision API 从文档中提取文本和数字表。结果远非令人满意 - Vision 似乎完全错过了我表中 2 列的内容。

当我手动擦除列边框时识别率会提高,但我无法预处理我打算处理的每个文件。裁剪列文本,将列文本移动到新位置似乎没有什么不同。增加文档的亮度/对比度似乎有点帮助,但不足以令人满意。我正在使用 cloud.google.com/vision/docs/drag-and-drop 上的“Try-It”网络界面来测试我的所有实验......它模仿了在文档上运行我的代码的结果。我正在上传从扫描的 PDF 原件(在 photoshop 中转换)创建的 JPG 图像。

我没有任何代码,因为问题仅在使用网络工具时出现。

许多数字是个位数,但很多不是。
错过的数字是 1,3,4,8,500,1,16,100,10
其他列(可以读取)包含十进制数字

也许有一些我没有发现我可以使用的技巧/技巧?

标签: google-cloud-platformgoogle-cloud-vision

解决方案


推荐阅读