google-cloud-vision - PDF OCR 谷歌云视觉保持间距
问题描述
我不知道这是否可能,但我收到了 PDF 格式的表格。我需要将 PDF 中的文本放在与文件中完全相同的位置,并将其放在我可以解析的文本文档中,如下所示:
第 4 行 startCharacter 50 endcharacter 60
这会给我那个位置的任何文本。
这可能吗?
解决方案
目前,无法做到这一点。我发现向 Cloud Vision API 发出的功能请求以获取 PDF 文件并将其导出为可搜索的 PDF,这可能会解决此问题。我建议您订阅功能请求(单击标题旁边的星号),以便获得更多可见性。
同时,您可以查看有关 PDF 识别的文档以进行尝试,看看您是否可以获得所需的行为。
如果您正在使用的表单具有确定的格式,您可以通过查看 API 的TextAnnotation响应来解决问题。响应为您提供文本,以及对它的其他见解,例如页面、段落等。
推荐阅读
- java - Spring MVC - 在表单上填充模型
- google-sheets - 基于当前单元格中的公式的 GoogleSheets 条件格式
- python - 避免使用另一个类的对象列表在两个类中重复方法的最佳实践?
- swift - Class怎么不继承一些变量呢?
- visual-studio-code - 我可以禁用在 vscode 中显示错误消息的红色覆盖框吗?
- java - Junit 5的Spring Boot单元测试为什么模拟返回null
- c# - Quartz.NET 3.2.3 与 Autofac 6.1.0 依赖注入 ASP.NET MVC
- javascript - 遍历数据库对象并将数据附加到 Javascript 中具有特定键值的对象
- flutter - 在颤动中同时显示菜单图标和后退按钮
- r - 如何更改 x 轴刻度以反映另一个变量?