apache-spark - Spark cassendra yugabyte 连接器问题从表中获取记录
问题描述
例如下面是我的代码:
spark = SparkSession.builder.appName('SparkCassandraApp')\
.config('spark.cassandra.connection.host', 'xx.xx.xx.xx') \
.config('spark.cassandra.connection.port', '9042') \
.config("spark.cassandra.auth.username","username")\
.config("spark.cassandra.auth.password","password")\
.getOrCreate()
df = spark.read.format("org.apache.spark.sql.cassandra").option("table","local").option( "keyspace","system").load().select('host_id')
df.show()
出现以下错误:
错误executor.Executor:阶段0.0(TID 0)中任务0.0中的异常java.io.IOException:准备SELECT“host_id”FROM“system”期间出现异常。“local”WHERE token(“key”)<?允许过滤:org/apache/spark/sql/catalyst/package$ScalaReflectionLock$ at com.datastax.spark.connector.rdd.CassandraTableScanRDD.createStatement(CassandraTableScanRDD.scala:323)
我在用着
火花版本:2.4.6
斯卡拉版本:2.11.12
spark -cassandra-connector spark-cassandra-connector_2.11-2.0.5-yb-2.jar
解决方案
对于 Spark 2.4.x,您需要使用 Spark Cassandra Connector 2.4.3 或者更好的是新发布的 2.5.0。Spark Cassandra 连接器仅与 Spark 2.0-2.2 兼容。请参阅兼容性矩阵。
请参阅有关如何将 SCC 2.5.0 与 pyspark 一起使用的说明。
推荐阅读
- android - 从 firebase 实时数据库中检索特定数据到文本视图
- c# - 如何比较实体框架中具有相同表名的两个模型之间的数据?
- image-processing - 我有一个包含图像描述的图像数据和元数据,我如何使用图像图像和元数据来训练图像
- python - 将数据从文本文件加载到python中的字典
- android - 无法从服务器加载 ViewPager 中的图像
- python-3.x - 耦合质量系统的编写脚本
- javascript - 重置 javascript 构造函数时出现问题
- android - 列表视图在项目单击时显示多个字符串数组
- json - 循环遍历 excel vba 中的 JSON 对象键
- mysql - 不知道如何表达 COUNT() 语句