首页 > 解决方案 > 从教科书图像中检测文本并创建相同的文本文件

问题描述

我正在构建一个应用程序,它可以从包含文本的页面(比如教科书的页面)的照片创建一个文本文件,这样两者显然是相同的。我在 PYTHON 中使用了 google-cloud-vision 来检测文本并获取图像中文本的坐标。现在这些是我面临的问题:

  1. 我使用什么库(或其他东西)来创建文本文件,以便我可以编写不同大小的文本(存在于输入图像中)?-> 高优先级
  2. 我如何确定一个单词是用粗体还是斜体书写,或者它是否带有下划线或确定它的字体等?第二高优先级
  3. 假设有一个包含许多行和列的 TABLE;如何检测表格然后将其写入文本文件中?

这是一个示例(也是最简单的)输入图像:

这是输出(单词)文件的屏幕截图:

标签: pythontextcomputer-visiondetectiongoogle-cloud-vision

解决方案


推荐阅读