首页 > 解决方案 > 如何使用节点 js 将 S3 连接到 Amazon Textract

问题描述

我一直在做自己的项目,使用 AWS 构建 OCR。我的主要想法是使用 node & express ,我已经成功创建了上传页面,每当对我的 S3 存储桶的 POST 请求(文件上传)来时,我都会保留一个触发器,我正在向 lambda 发送触发器通知并调用它.... .

我不知道如何将我的文件发送到亚马逊文本提取......如果有人能解决我的问题,我将非常感激......

我的用例:

用户->上传文件(S3)->亚马逊文本提取->情绪分析/关键短语->逻辑->结果。

标签: javascriptnode.jsamazon-web-servicesamazon-s3aws-lambda

解决方案


此异步流程适用于您的情况。

  • 在 S3 存储桶中创建对象时触发 lambda。(您将文件上传到此存储桶)https://docs.aws.amazon.com/lambda/latest/dg/with-s3.html
  • 当触发 s3 事件 lambda 时,从负载中提取 s3 存储桶名称和密钥,并使用 aws sdk 将它们传递给 textract api 调用。
  • AWS Textract 将其状态发布到 AWS SNS,因此您有第二个 lambda 函数订阅了 sns 主题并在成功完成 sns 消息负载作业时提取 textract 结果。

Browser/Express backend -> S3(file upload) -> Lambda(Get S3 bucket & key) -> AWS Textract -> SNS -> AWS Lambda -> 你的逻辑在拉取 textract 结果后继续。

https://docs.aws.amazon.com/textract/latest/dg/API_StartDocumentAnalysis.html https://docs.aws.amazon.com/textract/latest/dg/API_StartDocumentTextDetection.html


推荐阅读