opencv - 使用 pytesseract 提高 OCR 的质量
问题描述
我正在尝试使用 pytesseract 识别此图像中的文本,但我无法获得令人满意的结果。我尝试了很多方法来让 tesseract 更容易识别文本。我的 tesseract 版本是 5.0
- 从图像中取出颜色,只留下黑白
- 转换成灰度然后读取
- 尝试了高斯模糊
- 炸毁图像以确保它可以更有效地读取它
- 尝试了反向阈值以使图像更加突出,但仍然没有积极的结果。
解决方案
推荐阅读
- css - 文本下划线与空格交叉
- python - 如何使用熊猫数据框计算平均有符号误差?
- python - 从列表循环中的 lambda 获取正确的值
- c++ - dlib 的链接问题:使用 -fPIC 重新编译
- javascript - 带有日期和时间的 txt 文件中的 Node.js console.log()
- android - 具有 SurfaceTexture + 转换矩阵的 MediaCodec - 为 VIDEO_SCALING_MODE_SCALE_TO_FIT(_WITH_CROPPING) 传递自定义输出大小?
- cypress - 在 Cypress 中,在 UI 操作之后如何在 Network 选项卡中触发检查特定 API 调用并验证 Status 为 200
- c# - CopyFromScreen 仅在触摸屏上复制不正确的位置
- java - 使用 GeoTools,如何将世界坐标(纬度/经度)转换为像素坐标?- 爪哇
- python - Python protobuf 转换为 json