首页 > 解决方案 > pdf'StatusMessage'上的AWS文本:'INVALID_IMAGE_TYPE'

问题描述

我正在尝试在 pdf(约 140 页)上进行 OCR。我一直在将它上传到 s3 并执行 textract.start_document_text_detection 并在我的存储桶中创建了 .s3_access_check 。在我尝试使用相同的 jobId 进行 textract.get_document_text_detection 之后,一切看起来都找到了,但得到了“StatusMessage”的响应:“INVALID_IMAGE_TYPE”。任何帮助将不胜感激。

标签: pythonpdfamazon-textract

解决方案


推荐阅读