首页 > 解决方案 > Goole OCR 未检测具有其结构的表

问题描述

我按照教程尝试使用 Google OCR 将图像转换为文本,我有一个表格,它的格式为“ Text value value value”,但 Google OCR 将其读取为

Text

Value

Value

Value

有没有办法按原样阅读?不丢失文本与价值的关系?

标签: ocrtesseract

解决方案


即使我也面临同样的问题。经过大量研究后,我发现有一些叫做 table OCR 和 vision api 的 TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION 不是 table ocr 的意思,它们不适合表格数据复制,你需要大量的 opencv 图像预处理来完成。相反,您可以在互联网上使用表 OCR API'(免费),

他们确保您的文本值关系没有被破坏他们 OCR 输出的 营养数据

将会

Nutrition fact blah blah boo Totalfat 0g 0%//in the same line Sodium 0mg 0%//in the same line ......... ..

因此您可以将“\t”保留为分隔符并复制表格

希望我的回答会有所帮助:)


推荐阅读