首页 > 解决方案 > 如何从数据集中对几列进行分组并返回所有列选择?

问题描述

我想使用groupByAttributes列表对数据集进行分组,我这样做:

  Dataset<Row> groupedRows = initDataset.select(initDataset.col("*")).groupBy(groupByAttributes.toArray(new Column[groupByAttributes .size()])).agg(count("*"));
     

如何返回groupedRows所有列initDataset

PS:joins没有太大帮助。

标签: apache-spark

解决方案


推荐阅读