首页 > 解决方案 > 文本的光学识别及其结构分析(标题、副标题、正文)

问题描述

我们希望分析具有文本(非手写)的文档扫描和具有非常广泛的不同语言的排列/结构的图像。我们尝试解决的第一个问题是提取文本以及识别和分离标题、副标题和文本主体。

目前我们正在进行文献研究。有大量关于深度学习、计算机视觉、光学字符识别或自然语言处理的文献,但没有一个真正关注文本结构的光学识别。

我们想知道,处理文本结构光学识别的学科/领域的名称是什么?

解决这些问题的最先进的方法和工具是什么?

标签: deep-learningnlpcomputer-visionocrdigitization

解决方案


光学布局识别 (OLR)。可以在此处找到用于布局分析和区域提取的开源工具的一个很好的示例。


推荐阅读