amazon-web-services - 在 Docker 映像中使用 Spark-Submit?
问题描述
我想知道有关 PySpark 应用程序的一些事情。如果我将一个名为 的 PySpark 程序容器化my_spark_script.py
,我可以在 Docker 容器内执行它吗?我的意思是问,像这样的 Docker 文件是否有效:
WORKDIR /app
COPY . .
RUN pip3 install -r requirements.txt
CMD spark-submit --master yarn --deploy-mode cluster--num-executors 2 my_spark_script.py // <-- ???
我可以将其构建为:
docker build -t my_docker_image .
然后运行它
docker run -d my_docker_image
我想知道这是否可以在 AWS EC2 或 AWS EMR 或其他类似的东西上运行?它会起作用吗?
我只是不知道容器CMD
在 EC2 或 EMR 等环境中是如何工作的。请帮忙!
解决方案
Amazon Elastic Container Service (ECS) 是一种用于运行 Docker 容器的托管 AWS 服务。ECS 提供 Fargate 启动类型,这是一个无服务器平台,容器服务通过该平台在 Docker 容器而不是 EC2 实例上运行。要将源代码构建到 Docker 映像中,您可以使用 AWS CodeBuild 服务和用于持续集成的 AWS CodePipeline,请在此处查看以下示例。
推荐阅读
- ruby-on-rails - 在 Rails 中集成 CKEditor 自动链接插件
- c++ - 如何反转二叉搜索树?
- java - java.util.concurrent.ExecutionException:com.android.builder.internal.aapt.v2.Aapt2Exception:Android资源链接失败flutter_youtube
- elasticsearch - 重新索引和更新连接字段
- php - 在 WordPress 中使用 add_shortcode() 在主页中创建内容部分
- java - Java:搜索两个字符串之间的第一个公共字符
- python - 如何仅将字符串数组的整数转换为numpy中的浮点数组?
- json - 如何从 api.weather.gov 获取德克萨斯车站或区域或办公室或网格点或其他任何东西的每小时预报?
- css - 如何应用 object-fit: 也包含到 div?
- symfony4 - @Assert\Choice(callback="...") 是否仅适用于表单构建器?