java - 如何将 RDD 转换为 POJO 的另一个 Java 列表?
问题描述
输入是一个RDD
,期望的输出是 Java 列表POJO
从 SQL 中给出类似的例子:
select col1, col2, col3, sum(col4) from table
group by col1, col2, col3;
作为 Java Spark 的新手,到目前为止已经能够达到 tuple2 :
JavaPairRDD<Tuple2<Integer, String>, Integer> pairRDD =
rdd.mapToPair(e -> new Tuple2<>(new Tuple2<>(e.getCol1(), e.getCol2()), e.getCol3()))
.reduceByKey((v1, v2) -> v1 + v2);
如何使用它PairRDD
来创建POJO
具有键属性和总和值的 Java 列表?
解决方案
推荐阅读
- java - 如何验证字符串是否是 Java 中的有效 URL(包括深层链接)
- c# - 如何在 proto3 版本中将此 c# 类转换为 brotobuf?
- php - Wordpress:Learnpress 按自定义字段值(价格)显示课程
- javascript - Javascript从字符串转换为实例名称
- javascript - 取消选中按钮单击时的图例
- java - 使用 Jackson 序列化 ImmutableMap 时如何保留类型信息?
- java - java程序计算字符串中的单词
- sql - 当表为 YYYY-MM-DD 时,SQL 查询使用 YYYY-DD-MM 格式
- php - php会话变量不在页面之间保留
- c++ - 如何从单独的线程控制 SFML 窗口?