image - 计算文档图像中的白斑度量
问题描述
论文'基于度量的异构文档图像的无参考质量评估'讨论了测量文档图像中字符的质量。我很难理解第 7 页中的白斑度量。
小白斑测量加粗的字符笔划缩小了字符内部现有的白色连接组件,或者通过连接字符笔划创建了新的组件。计算文档图像中白色连通分量的直方图,我们已经找到了最常见的字体大小。然后通过将 1 像素和 1% 字体大小平方之间的直方图 bin 相加来计算白色斑点。然后通过除以 1 和字体大小平方之间的直方图下面积来归一化总和。
我的问题是:
- 如何计算文档图像中白色连通分量的直方图?
- 如何通过将 1 像素和 1% 字体大小平方之间的直方图 bin 相加来计算白色斑点?例如,最常见的字体大小是 32,所以我必须将直方图 bin 1 的频率加到 32^2 (1024) 的百分之一?那正确吗?
- 老实说,我没有看到计算或总结 1 像素和 1% 字体大小平方之间的直方图箱的任何关系 small
white speckle measure
。你能帮我看看关系吗?
谢谢。
解决方案
我没有阅读整篇论文,但它认为我理解他们在做什么。
该文档由白色背景上的黑色宪章和二进制图像组成(我不知道他们如何准确地阈值图像,但我认为这是输入)。在这些包机内有一些小的白色区域。
- 计算图像中的连通分量。假设您在文档中有 N 个。每个连接的组件都有一个大小,即组件具有的像素数。使用组件的大小,我们可以创建一个直方图,计算大小为 1、2、...的组件的数量。
我们正在寻找包机内的斑点。该论文将一个小散斑定义为一个连接组件,其大小为 1 像素,直到最常见的宪章区域的 1%。包机区域是字体大小的平方。因此,当您声明将对 32^2 的 1% 到 1% 之间的所有 bin 求和时,您是正确的
他们将小斑点定义为具有一些小尺寸的连接组件,特别是等于字体大小平方的 1% 的大小。为了测量文档中有多少斑点,您只需将所有符合此定义的连接组件相加即可。最后,您对其进行了标准化,以便您可以在不同文档之间进行比较。
您可以不同意那里的假设,并认为可能应该定义完全不同的小斑点,但这是那里的定义。
希望我能有所帮助
推荐阅读
- c++ - 为什么字符串比较会导致无限循环
- angularjs - Angular 1.6.1 ng--option 值以 type 为前缀:
- swift - PromiseKit 6、Alamofire、Xcode 10.2/Swift 5
- javascript - 如何在javascript中舍入十进制数
- maya - Mel Button Color ScriptJob?
- knockout.js - 如何使用 KnockoutJs 更改我的语言内容?
- sql - 根据条件获取列的总和
- python - 如何确保函数按特定顺序运行?
- python - 如何使用 Mechanical Soup 在 textarea 中设置文本?
- java - 无法设置正确的文件路径