首页 > 解决方案 > 使用 OCR 进行表单识别,用于根据不统一的特许权文件构建数据库

问题描述

在为我的学士论文构建预测性维护 AI的过程中,我遇到了从一大堆特许文件 (PDF) 中提取维护数据的难题。

我正在尝试使用 AI 软件(如 Azure Form Recognition、Google Document AI...),但由于论文不完全统一,因此不会得到令人满意的结果。论文中的表格(最有趣的)因数量、长度和位置而异,这使得很难使用通过边界框训练的 AI。不过,表格本身的结构对所有人都是一样的。

此外,这些表格应标有其各自的标题,该标题写在表格上方。

我的方法:

  1. 我尝试使用表格标签单独训练 Azure FR,但这使得训练模型过于复杂而无法处理并返回重复错误。
  2. 我使用了 Azure FR(和 Google Document AI)的布局 API,它很好地返回了表格,但没有用相关的标题标记它们。小问题:它使用一些不需要的表(如特征表等)提取所需的表

有没有人知道如何从这些表格中获取数据,或者只是通过 AI 标记已识别的表格?

如果有人有想法,我会非常高兴!提前致谢!

我希望我的观点足够清楚,但遗憾的是我无法展示我提到的表格的任何图像,因为它们都在 NDA 之下。

标签: azuremachine-learningartificial-intelligenceocrtext-extraction

解决方案


推荐阅读