azure - 使用 Azure Forms Recognizer 进行多页表隔离
问题描述
这个问题与 Azure Forms Recognizer 有关。我们正在处理文档中的扫描/非扫描 pdf 和表格。
如果一个包含行级项目(行和列)的表格在 pdf 文档中跨越多个页面,我们通常需要为每个页面创建不同的标签。
是否有一种解决方法可以在不为每个页面创建标签的情况下实现相同的效果?假设我们的训练数据有 2 页的表格,而在稍后的时间点,生产数据可能有 n 个表格的页数。提前致谢 !
我们已经到了这里,截图如下:
解决方案
表单识别器尚不支持跨多个页面的表格。为了不标记所有页面,您可以在将 PDF 发送到表单识别器之前将其拆分为页面,然后将它们发布到单个表中。
推荐阅读
- c# - C# Web API 在 POST 上总是得到一个空值
- sql - SQL Server全文搜索,在多个字段上排名
- javascript - Typeahead 和 Bloodhound 动态更改本地值
- iis-7.5 - 在托管管道集成模式下使用 ApplicationPool 访问 IIS 7.5 的 HTTPModule 中的 BeginRequest/EndRequest 事件
- android - 无法将 Fabric 中的应用链接到现有 Firebase 项目
- mysql - 如何使用触发器来防止删除表并改为更新?
- vuejs2 - 为 Vuetify 组件全局设置道具(在我的例子中是`v-data-table`)
- html - 使用 CSS 在悬停时放大图像但保持图像大小。我让它工作了,但它只显示图像的一个角落
- c# - 将 Jwt 令牌或声明主体转换为 SAML 令牌
- javascript - 何时在 Nodejs 中使用匿名函数?