首页 > 解决方案 > 使用 Azure Forms Recognizer 进行多页表隔离

问题描述

这个问题与 Azure Forms Recognizer 有关。我们正在处理文档中的扫描/非扫描 pdf 和表格。

如果一个包含行级项目(行和列)的表格在 pdf 文档中跨越多个页面,我们通常需要为每个页面创建不同的标签。

是否有一种解决方法可以在不为每个页面创建标签的情况下实现相同的效果?假设我们的训练数据有 2 页的表格,而在稍后的时间点,生产数据可能有 n 个表格的页数。提前致谢 !

我们已经到了这里,截图如下:

表单识别器表分离

标签: azureformsmicrosoft-cognitiveform-recognizer

解决方案


表单识别器尚不支持跨多个页面的表格。为了不标记所有页面,您可以在将 PDF 发送到表单识别器之前将其拆分为页面,然后将它们发布到单个表中。


推荐阅读