python - 在 S3 对象到达时从 Lambda 触发 EMR 上的 python 脚本以及对象详细信息
问题描述
我正在尝试触发 lambda 函数对象到达 s3 以及名称和路径等对象详细信息。然后在 EMR 上触发 python 脚本,它将访问 s3 上的文件。请让我知道如何触发 python 脚本(可能在 pig / hive 脚本中?)来处理 EMR 上的文件,这将触发此操作?
一旦我们获得了 hive/pig 脚本的 lambda 触发器的详细信息,就将文件复制到本地。
s3_client = boto3.client('s3')
s3_client.download_file('s3:n//<bucket name>/','', '/home/hadoop/data/')
请让我知道怎么做。文件将每 30-40 分钟发送一次。
解决方案
推荐阅读
- kubernetes - 是否有任何 API 或编程逻辑来获取 kubernetes 集群中节点的容量?
- rest - DRY 或 DAMP - API 自动化测试脚本中哪一个更高效?
- c++ - 将 C++ 流操纵器链接到单个变量中
- android - 如何禁用Android应用程序的远程调试
- python - 将路径表示为彩色图像
- java - JAVA:如何使用流从列表中删除重复项
- ios - 在 swift 5 中使用未解析的标识符“消息”?
- c# - php转c#aspnet mvc
- c# - 如何在 ms-access VBE-Add-in 中删除一行活动 CodePane 后当前设置光标?
- c++ - 在c ++中组合两个不同向量的比率