java - 如何远程提交火花作业
问题描述
我有未安装 spark 的 Nodejs 服务器,并且在不同的服务器中设置了带有 YARN 的 spark。
要求是从 Nodejs 服务器远程运行 spark 作业。有人可以帮忙吗?
感谢您的及时回复。
解决方案
远程生成进程是不可能的。我建议你以下方法,
- 在运行 Node 服务器的地方安装 spark,并将其用作客户端以指向实际的 spark 集群。您的节点服务器可以使用此客户端在远程集群上以客户端模式触发作业。
- 您可以在 spark 集群上设置一个 rest api,并让您的节点服务器访问该 api 的端点,这将触发作业。
详细说明上述答案,选项 1 涉及在两个系统上都安装 spark - 一个具有节点服务器和实际的 spark 集群。节点服务器上的 Spark 充当主 Spark 集群的客户端。选项 2 侧重于创建一个处理触发器的 rest API,这些触发器直接在主集群上启动 spark 作业,这样可以节省 2 次安装。
希望这可以帮助。
推荐阅读
- java - 如何在 JtextArea 中为选定的文本添加下划线
- mysql - 具有可升级帐户的数据库
- java - 在控制台执行运行命令时如何为java程序提供外部文件?
- list - 检查空白空间并返回布尔值
- java - 使用 Base64 将 BigInteger 转换为 String 并反转结果
- java - 我正在尝试创建一个界面,我们可以在其中单击按钮执行 .exe 文件以安装为/w
- magento2 - Magento 2,通过更新布局 xml 在类别页面底部带来类别描述
- algorithm - 通过用宝马替换它来最小化最大的现代
- sql - SQL 使用一个表中的多个值从另一个表中的一个字段中获取对应的值
- python - 如何将数据窗口传感器数据导入 python 以馈送到 CNN 以进行 HAR