首页 > 解决方案 > 结合 map、reduceByKey 和另一个 map

问题描述

数据是元组的集合,格式为:(group, number)

data.map(a => (a._1, (a._2, 1)))
.reduceByKey((a,b) => (a._1 * b._1, a._2 + b._2))
.map(a => (a._1, pow(a._2._1, 1/a. 2._2))

作为 Spark 的新手——提供的代码在做什么?你能给我解释一下这段代码吗?

标签: scalaapache-spark

解决方案


推荐阅读