apache-spark - 三角洲湖蟒
问题描述
我在现有的 hadoop 集群中设置了一个虚拟环境。由于当前集群没有 spark >3 ,所以我使用虚拟环境安装了 delta spark。在尝试访问作为 kerberose 之一的 hdfs 时,出现以下错误。你能帮忙就这个问题提供建议吗
客户端身份验证模式 SIMPLE,区域不支持机制,Auth:kerberos_only
from delta import *
builder = pyspark.sql.SparkSession.builder.appName("MyApp") \
.config("spark.sql.extensions", "io.delta.sql.DeltaSparkSessionExtension") \
.config("spark.sql.catalog.spark_catalog", "org.apache.spark.sql.delta.catalog.DeltaCatalog")
spark = configure_spark_with_delta_pip(builder).getOrCreate()
spark.read.parquet("hdfs/parquet_path")
解决方案
推荐阅读
- arrays - ngFor 不更新视图,除非单击视图 Angular
- sqlite - 我应该按什么顺序在 SQLite3 数据库中调用 ANALYZE 和 VACUUM?
- php - 服务器端渲染mysql限制n行并分页
- reactjs - React Native App 将无法启动 - 反应原生版本不匹配和 RCTView 为 validAttributes 生成的视图配置与原生不匹配
- android - 结束通话时出现异常 - “pjsua_conf_disconnect(id, sink.id) 错误:值或参数无效”
- amazon-web-services - AWS CDK -- 找不到模块“@aws-cdk/aws-ec2”
- java - 如何计算数组中所有非负数的平均值
- java - 仅使用 maven 部署 jar 文件
- go - 没有返回值的 Go 函数如何修改数据?
- flutter - Flutter:从图片目录中获取图像