首页 > 解决方案 > 如何将数组中的多个句子转换为python中的单个响应?

问题描述

作为一种爱好,我开始使用 amazon textract 做一个项目,该项目有助于从照片或 pdf 中提取文本。现在我遇到了一个问题。根据我从它的文档中读到的内容,照片中的每个单词都是一个小“块”。当我尝试打印时,它打印得很好,但如果我必须使用该文本发送到某处,例如电子邮件等,我需要将整个文本作为单个文件。因此,我需要将所有文本块存储在一个响应中,以帮助我进一步使用。这是我被困了几天的地方。帮助表示赞赏。谢谢

def processor(name):
    textract = boto3.client('textract')
    response = textract.detect_document_text(
        Document = {
            'S3Object':{
                'Bucket':bucketName,
                'Name':name
            }
        }
        
     )
    for item in response["Blocks"]:
        if item["BlockType"] == "LINE":
            print (item["Text"])

标签: pythonarraysamazon-web-services

解决方案


下面的一个班轮应该可以完成这项工作

single_response = ' '.join(item["Text"] for item in response["Blocks"] if item["BlockType"] == "LINE")

推荐阅读