首页 > 解决方案 > 在 S3 对象到达时从 Lambda 触发 EMR 上的 python 脚本以及对象详细信息

问题描述

我正在尝试触发 lambda 函数对象到达 s3 以及名称和路径等对象详细信息。然后在 EMR 上触发 python 脚本,它将访问 s3 上的文件。请让我知道如何触发 python 脚本(可能在 pig / hive 脚本中?)来处理 EMR 上的文件,这将触发此操作?

一旦我们获得了 hive/pig 脚本的 lambda 触发器的详细信息,就将文件复制到本地。

s3_client = boto3.client('s3')
s3_client.download_file('s3:n//<bucket name>/','', '/home/hadoop/data/')

请让我知道怎么做。文件将每 30-40 分钟发送一次。

标签: pythonamazon-web-servicesamazon-s3hiveamazon-emr

解决方案


推荐阅读