apache-spark - 将 sparklyr 与 Hadoop 一起使用时出现权限错误
问题描述
我正在尝试sparklyr
使用 Hadoop 在集群上工作。当我跑sc <- spark_connect(master = "yarn-client", version = "2.8.5")
我收到此错误消息:
Error in force(code) :
Failed during initialize_connection: org.apache.hadoop.security.AccessControlException: Permission denied: user=rstudio, access=WRITE, inode="/user":hdfs:hadoop:drwxr-xr-x
at org.apache.hadoop.hdfs.server.namenode.FSPermissionChecker.check(FSPermissionChecker.java:319)
at org.apache.hadoop.hdfs.server.namenode.FSPermissionChecker.checkPermission(FSPermissionChecker.java:219)
at org.apache.hadoop.hdfs.server.namenode.FSPermissionChecker.checkPermission(FSPermissionChecker.java:189)
...
用户 rstudio 是我为 RStudio 服务器创建的。如何修复权限以使其正常工作?
解决方案
使用 hadoop 超级用户(在您的情况下看起来像hdfs
),您需要/user/rstudio
为您的 rstudio 用户创建一个 HDFS 主目录(),并更改其所有权,以便 rstudio 成为所有者。有关详细信息,请参阅http://www.hadooplessons.info/2017/12/creating-home-directory-for-user-in-hdfs-hdpca.html?m=1。
推荐阅读
- c++ - Aws::S3::S3Client::S3Client useVirtualAddressing 参数有什么作用?
- jquery - 根据表中存在的值在表中显示图标
- node.js - 如何修复 ORA-06550 调用
- c# - 我没有在数据网格视图上看到任何数据。Localdb 没有发送任何数据(北风)
- c++ - 防止链接静态库共享共享库
- node.js - npm install - ERESOLVE 无法解析依赖树
- html - 在 CSS 中为元素添加插入符号
- python - 如何从突出显示区域的图像中转录文本?
- python - 如何在执行 subprocess.Popen 时保留外壳上输出的原始颜色编码?
- oracle - 在 Oracle 中触发更新