首页 > 解决方案 > PROC SQL:collect_set 或 group_concat 等价物?

问题描述

鉴于以下数据,

data tmp;
   input class $ age gpa graduated;
   datalines;
    A 16 2.47 1
    B 13 3.65 1
    A 13 2.04 0
    B 12 2.3 0
    C 15 3.58 1
;
run;

我正在寻找这个输出:

class|unique_ages
A|13, 16
B|12, 13
C|15

来自 Hive/Apache Spark 的世界,像collect_set+这样的函数concat_ws运行良好,但我在 SAS 中没有找到等效的函数。

PROC SQL;
    SELECT
        class
        * some grouping function on `age`;
    FROM tmp
        GROUP BY class
    ;
QUIT;

类似的答案如下所示:我可以用逗号将多行分隔成一列吗?[重复]。分组行聚合和连接。

标签: sasproc-sql

解决方案


proc sql 没有该功能,但您可以先在 datastep 中使用。最后。

data tmp;
input class $ age $  gpa graduated;
datalines;
A 16 2.47 1
B 13 3.65 1
A 13 2.04 0
B 12 2.3 0
C 15 3.58 1
;
run;


 proc sort data=tmp out =have;
 by class age;
 run;

data want(keep = class group_ages);
set have ;
by class;
retain group_ages;
length group_ages $20.;
if first.class then group_ages = ' ';
else group_ages= catx(',', group_ages, age);
if last.class then output;
run;

推荐阅读