azure - Azure 计算机视觉为带有矢量图形的 pdf 返回垃圾
问题描述
Azure 计算机视觉 (OCR) API 返回已发送 pdf 片段的垃圾。Pdf 有一个可见的文本,比方说:4893759678
但实际上它是矢量图形(不是文本)。
当我选择图形时,将其复制并粘贴到记事本中,它类似于:(85;9r?A>?EV
. 对于 pdf 的某些部分,其中有带有数字的图像(光栅图形),它确实可以分析;它返回 ocr 文本。
如何修复它或如何指示 Azure 对矢量图形进行 ocr。我无法轻易更改 pdf。
解决方案
谢谢KJ。发布您的建议作为帮助其他社区成员的答案。
您通常不能剪切和粘贴 pdf 的位,尤其是二进制文件,必须将整个文件解密、反汇编、解码重建为对象并将那些重新组装成页面,然后您可以复制页面的某些部分。OCR 是像素解剖分析和重建,因此应该是矢量的无损(非 jpg)像素图像
您可以参考Azure Read API for Vector PDFs、Optical character recognition Read API和How to extract images from PDF files using c# and itextsharp
推荐阅读
- django - 带有 self.helper.layout 的小部件属性
- r - 如何计算 R 数据框中每天的分位数?
- python - 正则表达式返回第一个和最后一个匹配,而不是在匹配括号之间返回第一个和第二个匹配
- jquery - 编写此 jquery 函数的更清洁或更简单的方法?
- python - Python selenium webdriver:列表索引超出范围最多5个元素
- python - 如果在转换为数据框之前检测到,Python pandas 将删除页眉和页脚记录
- isabelle - 伊莎贝尔:函数没有代码方程
- swiftui - SwiftUI Menu - 菜单实际打开时的操作
- docker - 将docker(compose)图像semver标签记录到fluentd?
- javascript - 在 Google Log 功能之后但在用户登录之前调用 history.push