首页 > 解决方案 > 如何展平多个压缩 RDD?

问题描述

我压缩了三个 RDD,结果得到了一个嵌套结构。

val rdd1 = sc.parallelize(List(1, 2, 3))
val rdd2 = sc.parallelize(List(3, 4, 5))
val rdd3 = sc.parallelize(List(6, 7, 8))

val finalRDD = rdd1.zip(rdd2).zip(rdd3)

看起来finalRDD

((1,3),6)
((2,4),7)
((3,5),8)

如何将结构展平为以下?

(1,3,6)
(2,4,7)
(3,5,8)

标签: scalaapache-sparkrdd

解决方案


像这样的东西应该工作

finalRDD.map(r => (r._1._1,r._1._2,r._2))

推荐阅读