google-cloud-platform - Google vision 无法识别表格中的数字
问题描述
我的目标是使用 Google 的 Vision API 从文档中提取文本和数字表。结果远非令人满意 - Vision 似乎完全错过了我表中 2 列的内容。
当我手动擦除列边框时识别率会提高,但我无法预处理我打算处理的每个文件。裁剪列文本,将列文本移动到新位置似乎没有什么不同。增加文档的亮度/对比度似乎有点帮助,但不足以令人满意。我正在使用 cloud.google.com/vision/docs/drag-and-drop 上的“Try-It”网络界面来测试我的所有实验......它模仿了在文档上运行我的代码的结果。我正在上传从扫描的 PDF 原件(在 photoshop 中转换)创建的 JPG 图像。
我没有任何代码,因为问题仅在使用网络工具时出现。
许多数字是个位数,但很多不是。
错过的数字是 1,3,4,8,500,1,16,100,10
其他列(可以读取)包含十进制数字
也许有一些我没有发现我可以使用的技巧/技巧?
解决方案
推荐阅读
- android - 配备 M1 Max 芯片的新 MacBook Pro 上的 Android Studio?
- regex - 正则表达式匹配shell脚本中数组中的数字
- regex - 使用 Blueprism 提取正则表达式
- c - Makefile:计算更新的目标文件
- powerbi - Power Bi Embedded A SKU(恢复/暂停)
- python - 选择正确的范例来实现特定的编程任务
- charts - 水晶报表-如何为水晶报表图表添加过滤器
- php - WPML 翻译只显示一种语言的帖子
- html - CSS - 内联 SVG 会干扰行高?
- sql - 如何确认连接到哪个 DB Active Record?