首页 > 解决方案 > 获取图像中包含鼠标光标下单词的矩形

问题描述

我想使用OCR获取鼠标光标下的单词,主要是网页和电子书,我的程序是:

  1. 获取包含鼠标光标下单词的矩形的位置。例如,如果我的鼠标光标是打开的century,那么我需要获取包含century 在此处输入图像描述

  2. 截取矩形的屏幕截图

  3. 使用诸如 Tesseract 之类的 OCR 引擎将矩形图像转换为文本,然后我以这种方式在鼠标光标下获取单词:)

难点在于第一步,我对图像处理几乎一无所知,所以无法找到定位矩形的方法。速度在我的场景中很重要,所以请指导我一个快速有效的解决方案?非常感谢!

标签: pythonopencvimage-processingocrtesseract

解决方案


推荐阅读