如何在数据化框架中按组查找唯一值

Question

我创建了一个数据化框架，如下所示。

DT_EX = dt.Frame({'cid':[1,2,1,2,3,2,4,2,4,5],
                  'cust_life_cycle':['Lead','Active','Lead','Active','Inactive','Lead','Active','Lead','Inactive','Lead']})

在这里，我有三个独特的客户生命周期，每个客户的计数都可以发现，作为

DT_EX[:, count(), by(f.cust_life_cycle)]

随着，我有五个客户的ID，这些计数为

DT_EX[:, count(), by(f.cid)]

现在，我想看看每个客户生命周期中存在多少个独特的客户ID。

DT_EX[:, {'unique_cids':dt.unique(f.cid)}, by(f.cust_life_cycle)]

应该显示为Lead客户有3个唯一的客户ID，如(1,2,5)，Active用户有2个唯一的客户ID(2,4)等等。

我无法得到预期的效果，请你告诉我如何解决？

顺便说一下：我已经尝试在R data.table框架上重现同样的情况，它的工作。

DT_EX[, uniqueN(cid), by=cust_life_cycle]

Answer 1

另一答案