apache-spark - 如何使用 yarn rest api 提交作业以激发火花?我想使用 YARN REST API 提交作业以触发
问题描述
我正在构建一个用于触发火花作业和检查作业状态的界面。
我不能使用像 Livy、spark 作业服务器这样的 3rd 方库。我想通过 REST API 制作用于启动和提交作业以触发集群的 API。
解决方案
您可以使用火花作业服务器 - https://github.com/spark-jobserver/spark-jobserver
更新 -
没看到spark job server不能用,可以用下面的
作业提交
curl -X POST http://spark-cluster-ip:6066/v1/submissions/create --header "Content-Type:application/json;charset=UTF-8" --data '{
"action" : "CreateSubmissionRequest",
"appArgs" : [ "myAppArgument1" ],
"appResource" : "file:/myfilepath/spark-job-1.0.jar",
"clientSparkVersion" : "1.5.0",
"environmentVariables" : {
"SPARK_ENV_LOADED" : "1"
},
"mainClass" : "com.mycompany.MyJob",
"sparkProperties" : {
"spark.jars" : "file:/myfilepath/spark-job-1.0.jar",
"spark.driver.supervise" : "false",
"spark.app.name" : "MyJob",
"spark.eventLog.enabled": "true",
"spark.submit.deployMode" : "cluster",
"spark.master" : "spark://spark-cluster-ip:6066"
}
}
工作现状
curl http://spark-cluster-ip:6066/v1/submissions/status/driver-20151008145126-0000
推荐阅读
- c++ - 我无法通过光线追踪算法追踪超过 1 个球体
- python-3.x - GCP Pub/Sub - 如何从 BQ 计划查询中检索状态
- ios - 未按预期应用约束
- node.js - 如何使用 google drive api 查找特定文件夹的存储详细信息
- c++ - 为什么在 C++ 中不允许从 int (*)(int) 到 void* 的 static_cast?
- next.js - styled-jsx 中的动态样式未按预期运行
- c# - 如何使用 AlarmManager 在 Xamarin 中设置警报
- python - 操作超时,python,CVE-2009-2629
- python - Pandas 从数据集中获取 MySQL 创建表可执行脚本
- arrays - 如何使用欧几里得距离访问最相似行上的特定项目?