apache-spark - 如何获取 saveToCassandra 并使用它?
问题描述
我正在使用 spark-sql v2.3.1 将数据写入 cassandra v3.11.1。要将数据框写入 cassandra 表,我们可以使用
df.write.format("org.apache.spark.sql.cassandra")
.options(Map( "table" -> tname, "keyspace" -> keyspacename ))
.mode(SaveMode.Append)
.save();
但是对于相同的版本,我如何使用saveToCassandra()
方法我需要添加任何罐子,我已经添加了 spark-cassandra-connector 和 cassandra-driver-core。我需要添加更多的罐子吗?我得到一个 sparksession 作为 spark 并且它不支持 createDateFrame()
。
解决方案
saveToCassandra
在同一个包中,但它适用于 RDD,而不是 DataFrames。因此,如果您想使用该命令(确实应该是一个很好的理由),您只需要通过说df.rdd
, 并调用saveToCassandra
它来从数据框中获取 RDD。
推荐阅读
- excel - 在 Excel VLOOKUP() 函数中指定搜索方向
- axapta - 加载表单时更新甘特图中的视图范围
- r - R中带有分箱中值曲线/线的散点图
- dax - 计算基于一个活动创建了多少子活动
- docker - 如何在 Spring Boot 属性中引用 pkcs12 密钥库
- 3d - 使用 Maya 中的一致性工具重新拓扑高多边形地形
- sorting - COBOL 内部排序错误
- authentication - IBM MFP - 身份验证时出现间歇性 SocketTimeoutException
- r - 带有 IF ELSE 的功能不起作用
- java - 如何在不丢失 Java 比例的情况下使图像在屏幕上覆盖尽可能多的空间?