ocr - Goole OCR 未检测具有其结构的表
问题描述
我按照教程尝试使用 Google OCR 将图像转换为文本,我有一个表格,它的格式为“ Text value value value
”,但 Google OCR 将其读取为
Text
Value
Value
Value
有没有办法按原样阅读?不丢失文本与价值的关系?
解决方案
即使我也面临同样的问题。经过大量研究后,我发现有一些叫做 table OCR 和 vision api 的 TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION 不是 table ocr 的意思,它们不适合表格数据复制,你需要大量的 opencv 图像预处理来完成。相反,您可以在互联网上使用表 OCR API'(免费),
他们确保您的文本值关系没有被破坏他们 OCR 输出的 营养数据
将会
Nutrition fact
blah blah boo
Totalfat 0g 0%//in the same line
Sodium 0mg 0%//in the same line
......... ..
因此您可以将“\t”保留为分隔符并复制表格
希望我的回答会有所帮助:)
推荐阅读
- python-3.x - 从多个 URL 中提取数据帧,导出到一个 CSV
- identityserver4 - Blazor WASM + IdentityServer4 + 自定义用户存储
- assembly - 堆栈指针在 x86 系统上的工作原理
- android - React Native Fetch 命令在调试版本上返回 JSON,但不是发布版本
- vue.js - Nuxt.js/Axios 自签名证书错误
- r - 如何在 Shiny 的 daterange UI 中显示文本?
- node.js - 快速发布请求将我重定向到 json 页面,而不是显示成功或错误消息 toast
- c - 使用 libelf 在 ELF 文件中注入 .preinit_array 部分
- c# - 记住窗口设置(大小、位置、位置)并恢复,但到屏幕 1
- python - Python 池映射问题 - 列表列表