如何用非数字值对数据框进行分组和透视。

Question

我使用Python，我有一个由6列组成的数据集，分别是R、Rc、J、T、Ca和Cb。我需要先对 "R "列进行 "聚合"，然后再对 "J "列进行 "聚合"，这样每一个R，每一行都是一个唯一的 "J"。Rc是R的特征，Ca和Cb是T的特征，看下面的表格会更有意义。

我需要从。

#______________________            ________________________________________________________________
#| R  Rc  J  T  Ca  Cb|           |# R  Rc  J  Ca(T=1)  Ca(T=2)  Ca(T=3)  Cb(T=1)  Cb(T=2)  Cb(T=3)|
#| a   p  1  1  x    d|           |# a  p   1    x         y        z        d        e        f   |
#| a   p  1  2  y    e|           |# b  o   1    w                           g                     |  
#| a   p  1  3  z    f|  ----->   |# b  o   2    v                           h                     | 
#| b   o  1  1  w    g|           |# b  o   3    s                           i                     |
#| b   o  2  1  v    h|           |# c  n   1    t         r                 j        k            |
#| b   o  3  1  s    i|           |# c  n   2    u                           l                     |
#| c   n  1  1  t    j|           |________________________________________________________________|
#| c   n  1  2  r    k|           
#| c   n  2  1  u    l|
#|____________________|

data = {'R' : ['a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'c'], 
        'Rc': ['p', 'p', 'p', 'o', 'o', 'o', 'n', 'n', 'n'],
        'J' : [1, 1, 1, 1, 2, 3, 1, 1, 2], 
        'T' : [1, 2, 3, 1, 1, 1, 1, 2, 1], 
        'Ca': ['x', 'y', 'z', 'w', 'v', 's', 't', 'r', 'u'],
        'Cb': ['d', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l']}

df = pd.DataFrame(data=data)

我不想丢失Rc，Ca，Cb的数据。

Rc（或每个以'c'结尾的列）对每个R来说都是一样的，所以可以直接和R归为一组。

但Ca和Cb（或每一列以'c'开头的数据）对每个T来说是唯一的，会被汇总，否则会丢失。这些需要保存在新的列中，命名为Ca(T=1)表示当T=1时，Ca(T=2)表示当T=2时，Ca(T=3)表示当T=3时。Cb也是如此。

所以利用T，我需要为给定T的Ca和Cb分别创建T个数的列，即把Ca和Cb的数据写入新的列中。

PS.如果有帮助的话，J列和T列的数量是一样的，我需要为每个Ca和Cb创建T列，将Ca和Cb的数据写入新的列中。如果有帮助的话，J列和T列都多了一个唯一ID的列。

J_ID = [1,1,1,2,3,4,5,5,6]
T_ID = [1,2,3,4,5,6,7,8,9]

目前我试过的。

(
    df.groupby(['R','J'])
    .apply(lambda x: x.Ca.tolist()).apply(pd.Series)
    .rename(columns=lambda x: f'Ca{x+1}')
    .reset_index()
)

问题：只能用其中的一个C来做，我失去了Rc。

任何帮助都将是非常感激的!

Answer 1

另一答案