indexing - Excel Powerquery 索引列
问题描述
在一个表中,我有两列链接的父/子数据,然后我需要与第二个表合并。
我需要创建一个索引列来获取唯一记录,这样我就可以合并两个表。
这些表每个都有大约 300 000 条记录,所以我需要使用 Power Query 而不想使用 Excel。
我需要一个基于父级的索引列,然后为每个唯一的子级重新启动索引计数
Parent Child Index needed
123 AAA 1
123 AAA 2
123 BBB 1
234 CCC 1
234 CCC 2
234 CCC 3
解决方案
如果您的初始表格如下所示:
然后这段代码:
let
initialTable = Table.FromColumns({{"123", "123", "123", "234", "234", "234"}, {"AAA", "AAA" , "BBB", "CCC", "CCC", "CCC"}}, type table [Parent = text, Child = text]),
grouped = Table.Group(initialTable, {"Parent", "Child"}, {{"toCombine", each Table.AddIndexColumn(_, "Index", 1, 1), type table}}),
combined = Table.Combine(grouped[toCombine])
in
combined
应该给出预期的输出:
推荐阅读
- linux - 自动从选项列表中选择选项而不输入值
- docker - 在 helm install 之前将 go 二进制文件移动到 pod 的惯用方法是什么?
- vue.js - 两行 vuetify v-switch 标签
- apache - 无法通过 IP 限制对 SSL 上的 Apache 2.4 反向代理的访问
- oracle - 根据另一个表的总计数动态创建表
- python-3.x - 如何检查列中的值变化
- machine-learning - 机器学习模型是否可能具有低测试误差和高训练误差?
- c# - 如何将用户设置保存到文本文件,然后让应用程序设置文件读取和使用它们
- ubuntu - 安装 curl 后出现致命错误:调用未定义函数 curl_init()
- javascript - 使用 Puppeteer 时在下拉菜单中找不到可用的选择器?