ocr - 为什么 Tesseract OCR 使用 Otsu 二值化?
问题描述
为什么 Tesseract OCR 引擎使用全局阈值技术,例如 Otsu 二值化?局部阈值技术(例如 Sauvola、Niblack 等)在从图像中删除文本方面不是更有效吗?
解决方案
Tesseract 被用于谷歌图书项目和 AFAIK,他们运行测试以获得最佳二值化,而 Otsu 是最通用的。如果 Otsu 不适合您的情况,您可以在将图像发送到 tesseract 之前使用其他二值化算法。
推荐阅读
- c++ - 我是否在头文件中正确创建了一个对象?
- swift - userDefualt 在类被 segued 时不保存开关
- python-3.x - 如何在左侧空白处拆分列表的元素并将左右分配给不同的变量?
- xcode - 使用 `pod gen` 和 `xcodebuild build test` 为 Catalyst 设置 CI
- reactjs - 无法读取未定义的属性“scrollRequest”,即使它应该是
- javascript - 使用单个按钮多次更改文本并隐藏最后一个文本的按钮
- python - 如何在 Python 中将 txt 拆分为数组?
- c# - C#通过用户输入从列表中删除某个项目的问题
- r - 如何正确调用/子集 xts 对象中的特定列?
- c - c 中的 for 循环不会在循环的最后一次迭代中递增