python - 如何将数组中的多个句子转换为python中的单个响应?
问题描述
作为一种爱好,我开始使用 amazon textract 做一个项目,该项目有助于从照片或 pdf 中提取文本。现在我遇到了一个问题。根据我从它的文档中读到的内容,照片中的每个单词都是一个小“块”。当我尝试打印时,它打印得很好,但如果我必须使用该文本发送到某处,例如电子邮件等,我需要将整个文本作为单个文件。因此,我需要将所有文本块存储在一个响应中,以帮助我进一步使用。这是我被困了几天的地方。帮助表示赞赏。谢谢
def processor(name):
textract = boto3.client('textract')
response = textract.detect_document_text(
Document = {
'S3Object':{
'Bucket':bucketName,
'Name':name
}
}
)
for item in response["Blocks"]:
if item["BlockType"] == "LINE":
print (item["Text"])
解决方案
下面的一个班轮应该可以完成这项工作
single_response = ' '.join(item["Text"] for item in response["Blocks"] if item["BlockType"] == "LINE")
推荐阅读
- sas - 具有多个条件的 SAS WHERE 语句
- csv - 如何读取非 UTF8 编码的 csv 文件?
- laravel - 通过对象的数量更改 laravel 刀片 css 类
- blogger - 如何在 Blogger Layout v3 中的帖子之间显示广告?
- wpf - 如何在 Propertygrid 中显示强制名称字段(扩展 wpf 工具包 3.4.0 版)
- iframe - Youtube iframe:如何在嵌入式播放器中隐藏作者?
- sql-server - 如何将每个订单放置在其之前的订单日期旁边?
- sql-server - 为给定值准备 WHERE 子句字符串
- iis-10 - 在 iis(4.122.18.3) 中找不到 Oracle.DataAccess (ODAC)18.3
- sql - SSIS 包在脚本任务完成后绕过任务