amazon-web-services - AWS Glue 自动创建作业
问题描述
我有可以在 AWS GLUE 中运行的 pyspark 脚本。但是每次我从 UI 创建作业并将我的代码复制到作业时。无论如何我可以从 s3 存储桶中的文件自动创建作业。(我有所有将在运行时使用的库和粘合上下文)
解决方案
另一种选择是使用AWS CloudFormation。您可以在模板文件中定义要创建的所有 AWS 资源(不仅是 Glue 作业),然后在需要时从AWS 控制台或使用 cli更新堆栈。
胶水作业的模板如下所示:
MyJob:
Type: AWS::Glue::Job
Properties:
Command:
Name: glueetl
ScriptLocation: "s3://aws-glue-scripts//your-script-file.py"
DefaultArguments:
"--job-bookmark-option": "job-bookmark-enable"
ExecutionProperty:
MaxConcurrentRuns: 2
MaxRetries: 0
Name: cf-job1
Role: !Ref MyJobRole # reference to a Role resource which is not presented here
推荐阅读
- java - 为什么 Spring 在保存用户时告诉我控制器是未知实体?
- c - 如何在c编程中比较结构变量的值
- data-manipulation - 如何根据列/变量中的观察数向数据集添加行?
- javascript - JQuery 选择器 - 如何使用不同的 id 复制到剪贴板
- javascript - 从 Office Fabric UI 获取切换元素的值
- json - Django:将当前登录用户作为 JSON 发送
- c - 扫描二进制数的方法?
- c# - 如何根据 Unity 中的方向或运动来更改精灵?
- javascript - 删除 HTML 标记,但在文本中实现换行符(Regex 和 Javascript)
- arrays - Python循环不接受任何输入