azure - 使用 OCR 进行表单识别,用于根据不统一的特许权文件构建数据库
问题描述
在为我的学士论文构建预测性维护 AI的过程中,我遇到了从一大堆特许文件 (PDF) 中提取维护数据的难题。
我正在尝试使用 AI 软件(如 Azure Form Recognition、Google Document AI...),但由于论文不完全统一,因此不会得到令人满意的结果。论文中的表格(最有趣的)因数量、长度和位置而异,这使得很难使用通过边界框训练的 AI。不过,表格本身的结构对所有人都是一样的。
此外,这些表格应标有其各自的标题,该标题写在表格上方。
我的方法:
- 我尝试使用表格标签单独训练 Azure FR,但这使得训练模型过于复杂而无法处理并返回重复错误。
- 我使用了 Azure FR(和 Google Document AI)的布局 API,它很好地返回了表格,但没有用相关的标题标记它们。小问题:它使用一些不需要的表(如特征表等)提取所需的表
有没有人知道如何从这些表格中获取数据,或者只是通过 AI 标记已识别的表格?
如果有人有想法,我会非常高兴!提前致谢!
我希望我的观点足够清楚,但遗憾的是我无法展示我提到的表格的任何图像,因为它们都在 NDA 之下。
解决方案
推荐阅读
- javascript - 输入中的自动完成数据
- java - Gradle 任务不接受 Java 用户输入
- python - 在 PyQt5 中删除小部件时如何删除黑色空间
- system-verilog - SystemVerilog 中队列的最大大小是多少?
- node.js - Traefik 仍然需要端口规范
- excel - 如何在工作簿中搜索字符串然后将其写入同一行的列中?
- php - Laravel 调度程序和 docker cron
- excel - 使用 Excel 溢出范围作为递归 Lambda 函数的数据源
- python - 可以重建 2d 矩阵,其中掩码已与 numpy where 一起使用并展平
- makefile - 如何让 make 运行使用 make 变量在其中创建 azure 服务主体的命令