首页 > 解决方案 > 屏幕截图 > 文本 (OCR) > 关键信息

问题描述

我正在使用 Googles Vision API 来分析来自我们产品的错误消息的屏幕截图。使用这些托管服务,OCR 部分很容易,但是是否有任何最佳实践工具可用于实际文本?

更具体地说,错误屏幕截图将包含产品名称、产品版本、底层操作系统版本(如果操作系统是 32 位或 64 位)以及实际错误消息(C# Stacktrace)

所以所有文本都来自 OCR 扫描,但由于屏幕截图是由用户拍摄的,因此不能假设上面的不同信息位于屏幕截图的特定区域。

如何着手分析这些数据?我们是在谈论简单的字符串操作和自定义领域知识(试过这个,它让我走得很远),还是这是谷歌/微软提供的某种机器学习文本分析的工作(或者是矫枉过正)?

标签: machine-learningtextcomputer-visionocr

解决方案


所以所有文本都来自 OCR 扫描,但由于屏幕截图是由用户拍摄的,因此不能假设上面的不同信息位于屏幕截图的特定区域。

  1. 使用简单的模板匹配查找您在屏幕截图中查找的错误消息窗口。
  2. 在与您在步骤 1 中找到的位置相关的特定区域中使用 Googles Vision API,以获取特定信息。

推荐阅读