首页 > 解决方案 > Azure 计算机视觉为带有矢量图形的 pdf 返回垃圾

问题描述

Azure 计算机视觉 (OCR) API 返回已发送 pdf 片段的垃圾。Pdf 有一个可见的文本,比方说:4893759678但实际上它是矢量图形(不是文本)。

当我选择图形时,将其复制并粘贴到记事本中,它类似于:(85;9r?A>?EV. 对于 pdf 的某些部分,其中有带有数字的图像(光栅图形),它确实可以分析;它返回 ocr 文本。

如何修复它或如何指示 Azure 对矢量图形进行 ocr。我无法轻易更改 pdf。

标签: azureocr

解决方案


谢谢KJ。发布您的建议作为帮助其他社区成员的答案。

您通常不能剪切和粘贴 pdf 的位,尤其是二进制文件,必须将整个文件解密、反汇编、解码重建为对象并将那些重新组装成页面,然后您可以复制页面的某些部分。OCR 是像素解剖分析和重建,因此应该是矢量的无损(非 jpg)像素图像

您可以参考Azure Read API for Vector PDFsOptical character recognition Read APIHow to extract images from PDF files using c# and itextsharp


推荐阅读