首页 > 解决方案 > 计算文档图像中的白斑度量

问题描述

论文'基于度量的异构文档图像的无参考质量评估'讨论了测量文档图像中字符的质量。我很难理解第 7 页中的白斑度量。

小白斑测量加粗的字符笔划缩小了字符内部现有的白色连接组件,或者通过连接字符笔划创建了新的组件。计算文档图像中白色连通分量的直方图,我们已经找到了最常见的字体大小。然后通过将 1 像素和 1% 字体大小平方之间的直方图 bin 相加来计算白色斑点。然后通过除以 1 和字体大小平方之间的直方图下面积来归一化总和。

我的问题是:

  1. 如何计算文档图像中白色连通分量的直方图?
  2. 如何通过将 1 像素和 1% 字体大小平方之间的直方图 bin 相加来计算白色斑点?例如,最常见的字体大小是 32,所以我必须将直方图 bin 1 的频率加到 32^2 (1024) 的百分之一?那正确吗?
  3. 老实说,我没有看到计算或总结 1 像素和 1% 字体大小平方之间的直方图箱的任何关系 small white speckle measure。你能帮我看看关系吗?

谢谢。

标签: imageimage-processinghistogramsignal-processingoperations-research

解决方案


我没有阅读整篇论文,但它认为我理解他们在做什么。

该文档由白色背景上的黑色宪章和二进制图像组成(我不知道他们如何准确地阈值图像,但我认为这是输入)。在这些包机内有一些小的白色区域。

  1. 计算图像中的连通分量。假设您在文档中有 N 个。每个连接的组件都有一个大小,即组件具有的像素数。使用组件的大小,我们可以创建一个直方图,计算大小为 1、2、...的组件的数量。
  2. 我们正在寻找包机内的斑点。该论文将一个小散斑定义为一个连接组件,其大小为 1 像素,直到最常见的宪章区域的 1%。包机区域是字体大小的平方。因此,当您声明将对 32^2 的 1% 到 1% 之间的所有 bin 求和时,您是正确的

  3. 他们将小斑点定义为具有一些小尺寸的连接组件,特别是等于字体大小平方的 1% 的大小。为了测量文档中有多少斑点,您只需将所有符合此定义的连接组件相加即可。最后,您对其进行了标准化,以便您可以在不同文档之间进行比较。

您可以不同意那里的假设,并认为可能应该定义完全不同的小斑点,但这是那里的定义。

希望我能有所帮助


推荐阅读