Excel Power Query 索引列

Posted

技术标签:

【中文标题】Excel Power Query 索引列【英文标题】:Excel Powerquery Index column 【发布时间】:2020-01-17 23:49:22 【问题描述】:

在一个表中,我有两列链接的父/子数据,然后我需要与第二个表合并。

我需要创建一个索引列来获取唯一记录,以便合并两个表。

这些表每个都有大约 300 000 条记录,所以我需要使用 Power Query 而不想使用 Excel。

我需要一个基于父级的索引列,然后为每个唯一的子级重新开始索引计数

Parent   Child  Index needed
123      AAA     1
123      AAA     2
123      BBB     1
234      CCC     1
234      CCC     2
234      CCC     3

Table structure

【问题讨论】:

看看this article 【参考方案1】:

如果您的初始表格如下所示:

然后这段代码:

let
    initialTable = Table.FromColumns("123", "123", "123", "234", "234", "234", "AAA", "AAA" , "BBB", "CCC", "CCC", "CCC", type table [Parent = text, Child = text]),
    grouped = Table.Group(initialTable, "Parent", "Child", "toCombine", each Table.AddIndexColumn(_, "Index", 1, 1), type table),
    combined = Table.Combine(grouped[toCombine])
in
    combined

应该给出预期的输出:

【讨论】:

以上是关于Excel Power Query 索引列的主要内容,如果未能解决你的问题,请参考以下文章

pandas读取csv数据index_col参数指定作为行索引的数据列索引列表形成复合(多层)行索引使用方括号[]基于列索引名称元组索引列数据(index tuple)

pandas读取csv数据index_col参数指定作为行索引的数据列索引列表形成复合(多层)行索引使用方括号[]基于列索引元组列表索引多列数据(index tuple list)

pandas读取csv数据header参数指定作为列索引的行索引列表形成复合(多层)列索引使用set_index函数把数据列转化为行索引(keys参数指定需要被转化的层列索引)

pandas读取csv数据header参数指定作为列索引的行索引列表形成复合(多层)列索引使用set_index函数把数据列转化为行索引(keys参数指定需要被转化的层列索引)

[转帖]B树索引位图索引和散列索引

通过apache poi以excel方式获取索引值