首页 > 解决方案 > 有没有办法让 textract 将 pdf 图像呈现为 excel 数据表?

问题描述

我有一个数据表的 pdf,但它只是一个图像。意思是,我无法从中复制和粘贴值,并且 OCR 不可用。有没有办法使用 textract(或其他一些服务)来让数据表变得优秀?

标签: ocr

解决方案


您可以将 textract 用于其中的一部分,但没有办法很好地构建结果。例如,您可以列出包含“行”的文本块的长列表,但您需要一种类似于它们在 PDF 中的原始数据表中的结构方式来构造它们的方法。特别是最后一部分使这个问题非常具有挑战性。


推荐阅读