首页 > 解决方案 > Excel Powerquery 索引列

问题描述

在一个表中,我有两列链接的父/子数据,然后我需要与第二个表合并。

我需要创建一个索引列来获取唯一记录,这样我就可以合并两个表。

这些表每个都有大约 300 000 条记录,所以我需要使用 Power Query 而不想使用 Excel。

我需要一个基于父级的索引列,然后为每个唯一的子级重新启动索引计数

Parent   Child  Index needed
123      AAA     1
123      AAA     2
123      BBB     1
234      CCC     1
234      CCC     2
234      CCC     3

表结构

标签: indexingpowerquery

解决方案


如果您的初始表格如下所示:

输入表

然后这段代码:

let
    initialTable = Table.FromColumns({{"123", "123", "123", "234", "234", "234"}, {"AAA", "AAA" , "BBB", "CCC", "CCC", "CCC"}}, type table [Parent = text, Child = text]),
    grouped = Table.Group(initialTable, {"Parent", "Child"}, {{"toCombine", each Table.AddIndexColumn(_, "Index", 1, 1), type table}}),
    combined = Table.Combine(grouped[toCombine])
in
    combined

应该给出预期的输出:

输出表


推荐阅读