首页 > 解决方案 > 将拼字游戏屏幕截图解析为数据结构的最佳方法?

问题描述

我想将在线拼字游戏的屏幕截图解析为数据结构,以便我可以通过求解器运行它以获得最佳动作。我没有计算机视觉方面的经验,但是通过大学的课程对 ML 有一些基本的了解。任何想法,将不胜感激!

我在“如何解析游戏图像”和相关主题方面尝试过谷歌,我在使用 OCR 库方面有一些经验,但最难的部分是知道如何分割图像,因此 OCR 可以确定人物。

标签: computer-visionvision

解决方案


我考虑了一下你的问题。这里的主要目标是找到所有网格案例之间的水平和垂直间隙。

这是通过使水平梯度穿过图像而获得的图像。

在此处输入图像描述

在这里,我注意到案例之间不包含垂直边缘的水平线显示为全黑。因此,找到它们的一种方法是逐行计算该图像的平均值,并取最低值。

这是通过逐行计算该行平均值获得的图表:

在此处输入图像描述

由于第二张图片,我仍在努力拆分所有行。


推荐阅读