apache-spark - 如何从数据集中对几列进行分组并返回所有列选择?
问题描述
我想使用groupByAttributes
列表对数据集进行分组,我这样做:
Dataset<Row> groupedRows = initDataset.select(initDataset.col("*")).groupBy(groupByAttributes.toArray(new Column[groupByAttributes .size()])).agg(count("*"));
如何返回groupedRows
所有列initDataset
?
PS:joins没有太大帮助。
解决方案
推荐阅读
- .net-core - Telerik 报告 - 无法获取报告参数
- axios - 如何使用 nuxtjs 和 axios?
- powershell - Get-ChildItem ForEach-Object 与 foreach 问题
- javascript - 错误类型错误:无法读取管道未定义的属性“toLowerCase”
- c++ - 如何将元素移动到数组的末尾
- javascript - Vue js:如何清除应用的过滤器?
- c - 如何正确释放结构的 GHashTable
- c - 我的 C 代码有什么问题?C 代码警告
- c# - Autofac,如何解析/注入 Dispatcher?
- tensorflow - 多元线性回归问题的收敛问题