form-recognizer - 如何使用 Azure 表单识别器分析多文件表单
问题描述
我有一个分成 3 个不同 jpg 文件的表单,每个页面一个文件,是否可以指示表单识别器将它们视为一个表单?
我应该先合并到一个文件中吗?哪个是在单个 PDF 文件中合并 3 个不同 jpg 的最佳免费 Java 库?
谢谢你
解决方案
您需要将 3 个 jpg 文件合并为一个文件。
您可以尝试将其合并到 Az Form Recognizer 支持的 TIFF 文件,它支持多个图像/页面。
在没有任何额外库的情况下,这在 Java 中似乎是可能的。
检查这篇文章,因为它可能会给你一个想法。
此外,如果所有文档的页数和布局都相同,您可以使用未经标签训练的自定义模型来分析您的表单。
如果没有标签的模型不能给您带来好的结果,请尝试使用标签对其进行训练。
推荐阅读
- python - 使用 pdf2image 将 PDF 转换为图像不起作用
- gradle - 如何将子项目生成的类添加到 Gradle 中 WAR 文件的 WEB-INF/classes 目录
- android - 长度过滤器不适用于 textview ?- 安卓
- typescript - api 数据验证的最佳实践
- python - 在 Python Clicker 游戏中每秒添加硬币
- amazon-web-services - 使用 AWS cli 所需的 Amazon EMR 集群详细信息
- python - 在元数据之后检测 CSV 的开头
- reactjs - 从子组件访问 NextJs Link href 属性
- mysql - 这个查询不好吗?MySql 一对多与左连接和嵌套查询
- python - 如何使子进程在服务关闭后幸存下来?