首页 > 解决方案 > PDF OCR 谷歌云视觉保持间距

问题描述

我不知道这是否可能,但我收到了 PDF 格式的表格。我需要将 PDF 中的文本放在与文件中完全相同的位置,并将其放在我可以解析的文本文档中,如下所示:

第 4 行 startCharacter 50 endcharacter 60

这会给我那个位置的任何文本。

这可能吗?

标签: google-cloud-vision

解决方案


目前,无法做到这一点。我发现向 Cloud Vision API 发出的功能请求以获取 PDF 文件并将其导出为可搜索的 PDF,这可能会解决此问题。我建议您订阅功能请求(单击标题旁边的星号),以便获得更多可见性。

同时,您可以查看有关 PDF 识别的文档以进行尝试,看看您是否可以获得所需的行为。

如果您正在使用的表单具有确定的格式,您可以通过查看 API 的TextAnnotation响应来解决问题。响应为您提供文本,以及对它的其他见解,例如页面、段落等。


推荐阅读