azure - 如何更改在 Azure Databricks 中运行的 Spark 用户作业?
问题描述
我在 Azure Databricks 5.5 上使用 Spark。我通过 Jobs、Notebooks 和 Spark-submit 通过 Databricks 工作区 UI 提交 Spark 作业。作业已成功提交,并且正在生成 Databricks 新集群或正在使用现有集群。但是,在 executor 节点上运行作业的用户默认是root。是否可以更改在 Azure Databricks 上运行作业的用户(其本身不允许 SSH 访问)?
通常,当我在具有 Shell 访问权限的集群上使用 spark-submit CLI 时;我使用 sudo: 更改用户sudo -u exampleuser spark-submit...
。在此示例中,用户“exampleuser”出现在集群的所有节点上。因此,我想知道是否可以更改在 Azure Databricks 集群中运行 Spark 作业的用户。
解决方案
在与 Azure Databricks 团队讨论后,更改运行 spark 作业的用户的正确方法是在集群创建期间设置环境变量HADOOP_USER_NAME 。这会将运行 Spark 作业的有效用户从 root 更改为用户 $HADOOP_USER_NAME
推荐阅读
- c++ - 给定链表中的反向 K 节点
- mariadb - 神秘的 mariadb 10.4.1 内存使用情况
- curl - 通过 REST 端点从 Kismet 检索设备时出现问题
- selenium - 如何加快 AWS 设备场上的 selenium 测试?
- excel - 工具 --> 参考和 VBA 编辑窗口未能出现在 Excel 365 中 - 文件损坏?
- reactjs - 来自两个 API 的搜索结果
- java - 当我尝试将 ArrayList 添加到 ArrayList 中时,第二个 ArrayList 正在重复
- vim - Vim 快捷键选择和复制当前行而不包含下一行
- c# - UWP 绑定到自定义字典
- python - 在 Flask 单元测试中测试失败并出现 404 错误