kdb - 输出中的 KDB/Q-sql 动态分组和合并列
问题描述
我有一个表,我必须在动态列上执行 group by 并执行聚合,结果将是列值连接 group-by 表和用户提供的 col 聚合。
例如 :
g1 g2 g3 g4 col1 col2
A D F H 10 20
A E G I 11 21
B D G J 12 22
B E F L 13 23
C D F M 14 24
C D G M 15 25
如果我需要按 g1、g2、g4 执行分组,col1 输出上的 avg 聚合应该是这样的
filed val
Avg[A-D-H-col1] 10.0
Avg[A-E-I-col1] 11.0
Avg[B-D-J-col1] 12.0
Avg[B-E-L-col1] 13.0
Avg[C-D-M-col1] 14.5
如果我的按列分组是使用 q-sql 修复的,我可以执行此操作
t:([]g1:`A`A`B`B`C`C;g2:`D`E`D`E`D`D;g3:`F`G`G`F`F`G;g4:`H`I`J`L`M`M;col1:10 11 12 13 14 15;col2:20 21 22 23 24 25)
select filed:first ("Avg[",/:(({"-" sv x} each string (g1,'g2,'g4)),\:"-col1]")),val: avg col1 by g1,g2,g4 from t
我想使用相同的功能查询,这意味着我想要一个函数,它采用按列分组的列表、要执行的聚合以及列名和表名作为输入和输出,就像上面的查询一样。我可以通过轻松使用动态列来执行分组,但不能在字段中进行组合。函数签名将是这样的
有趣{[glist; 聚合;col,t] .. ;... }[ g1
g2 g4;
avg; col1,
吨]
请帮助我将上述查询设为动态。
解决方案
您可以尝试以下功能:
specialGroup: {[glist;agg;col;table]
res: ?[table;();{x!x}glist; enlist[`val]!enlist(agg;col)];
aggname: string agg;
aggname: upper[1#aggname], 1_aggname;
res: ![res;();0b;enlist[`filed]!enlist({(y,"["),/:("-"sv/:string flip x),\:"]"};enlist,glist,enlist[enlist col];aggname)];
res
};
specialGroup[`g1`g2`g4;avg;`col1;t]
specialGroup
首先将值聚合到val
列中。filed
并在分组后填充列。这有助于避免生成filed
重复项并选择其中的第一个。
推荐阅读
- javascript - 如何将点击位置作为JS中的参数传递给函数?
- batch-file - 回显到文本文件时,批处理文件删除一个 % 符号
- flutter - 颤振拉环
- python - 如何停止此程序中出现的空格?
- python - TypeError:添加的层必须是类Layer的实例。找到:Tensor("input_1:0", shape=(None, 64, 64, 3), dtype=float32) -Python
- javascript - 带递归的链表
- javascript - 如何在 Next JS 上显示没有页码的路由的第一页
- python - Pytorch UnpicklingError:遇到加载持久 id 指令
- tensorflow - 在运行 NLP 模型时是否需要安装 CUDA 才能使用 GPU,例如。本地机器上的 BERT
- entity-framework - 如何在 Blazor 中设计与使用实体框架的身份验证用户相关的模型?