scala - 如何展平多个压缩 RDD?
问题描述
我压缩了三个 RDD,结果得到了一个嵌套结构。
val rdd1 = sc.parallelize(List(1, 2, 3))
val rdd2 = sc.parallelize(List(3, 4, 5))
val rdd3 = sc.parallelize(List(6, 7, 8))
val finalRDD = rdd1.zip(rdd2).zip(rdd3)
看起来finalRDD
像
((1,3),6)
((2,4),7)
((3,5),8)
如何将结构展平为以下?
(1,3,6)
(2,4,7)
(3,5,8)
解决方案
像这样的东西应该工作
finalRDD.map(r => (r._1._1,r._1._2,r._2))
推荐阅读
- java - 安装 Apache POI 时遇到问题
- kotlin - 从 InputStream 中读取的挂起函数
- android - 我是否需要迁移才能将类型 Int 更改为 Long?
- c - 在这个 C 代码中 goto 语句是不可避免的吗?
- zipline - zipline :更改内置因素的输入数据
- r - 使用 ggplot 创建条形图
- c# - C# dotnet run 保持失败:错误:无法加载源的服务索引
- r - 相交两个 shapefile 后:`vapply 中的错误(g2,st_is_empty,logical(1))`
- amazon-web-services - AWS - 如何将保存的环境配置从一个应用程序加载到另一个应用程序
- python - 从我的 python 脚本在集群上加载环境模块