computer-vision - 为什么计算机视觉在提交图像子集时会识别更多文本?
问题描述
所以我正在尝试使用 Azure 计算机视觉 OCR 来识别 jpg 图像中的文本。该图像约为 2000x3000 像素,是一张合同图片。我想获取所有文本和边界框。图像DPI超过300,画质非常清晰。我注意到很多文本被跳过,所以我裁剪了图像的一部分并提交了它。这次它识别出它之前无法识别的文本。为什么会这样做?如果图像的质量从未改变并且图像在分辨率要求的范围内,为什么它会跳过文本?
解决方案
推荐阅读
- 3d - 在保持玩家全局方向的同时改变场景,3d
- javascript - 如何编写猫鼬查询来组合来自两个模型的数据?
- powershell - POWERSHELL - 添加列 + 更新几行
- javascript - ES2015:multikeys Map:瓶颈在哪里?
- python - 如何在 Python 中将两张图片(其中一张具有透明背景)合并为一张?
- r - mutate 中的嵌套 ifelse 无法识别 is.na 语句
- python-3.x - 如何将 kivy FocusBehavior 应用于 TextInput 以便使用 TAB 键切换到下一个 TextInput?
- python - 从 torch.autograd.gradcheck 中删除 zero_gradients
- algorithm - 在算法中 O(log(N!)) 比 O(N) 快吗?
- java - 如何使shell命令过程完成?