javascript - 如何使用节点 js 将 S3 连接到 Amazon Textract
问题描述
我一直在做自己的项目,使用 AWS 构建 OCR。我的主要想法是使用 node & express ,我已经成功创建了上传页面,每当对我的 S3 存储桶的 POST 请求(文件上传)来时,我都会保留一个触发器,我正在向 lambda 发送触发器通知并调用它.... .
我不知道如何将我的文件发送到亚马逊文本提取......如果有人能解决我的问题,我将非常感激......
我的用例:
用户->上传文件(S3)->亚马逊文本提取->情绪分析/关键短语->逻辑->结果。
解决方案
此异步流程适用于您的情况。
- 在 S3 存储桶中创建对象时触发 lambda。(您将文件上传到此存储桶)https://docs.aws.amazon.com/lambda/latest/dg/with-s3.html
- 当触发 s3 事件 lambda 时,从负载中提取 s3 存储桶名称和密钥,并使用 aws sdk 将它们传递给 textract api 调用。
- AWS Textract 将其状态发布到 AWS SNS,因此您有第二个 lambda 函数订阅了 sns 主题并在成功完成 sns 消息负载作业时提取 textract 结果。
Browser/Express backend -> S3(file upload) -> Lambda(Get S3 bucket & key) -> AWS Textract -> SNS -> AWS Lambda -> 你的逻辑在拉取 textract 结果后继续。
https://docs.aws.amazon.com/textract/latest/dg/API_StartDocumentAnalysis.html https://docs.aws.amazon.com/textract/latest/dg/API_StartDocumentTextDetection.html