Python Pandas Dataframe 数据透视表列和值顺序

Posted

技术标签:

【中文标题】Python Pandas Dataframe 数据透视表列和值顺序【英文标题】:Python Pandas Dataframe Pivot Table Column and Values Order 【发布时间】:2021-12-14 04:06:40 【问题描述】:

长期 XLS 用户仍然是 Python/Pandas 的新手。我正在尝试自动生成一些价格曲线的报告,但我无法以我正在寻找的格式获取 Pivot。提前感谢您的帮助!

我有一个这种格式的数据框:

 data = [['AAA',1,11,1,],['AAA',2,12,2],['AAA',3,13,3],
          ['BBB',1,21,5],['BBB',2,22,6],['BBB',3,23,7],
         ['CCC',1,31,9],['CCC',2,32,10],['CCC',3,33,11]]
            
    df = pd.DataFrame(data, columns = ['Curve', 'Tenor','Price','Change'])
        
    print(df)
    
      Curve  Tenor  Price  Change
    0   AAA      1     11       1
    1   AAA      2     12       2
    2   AAA      3     13       3
    3   BBB      1     21       5
    4   BBB      2     22       6
    5   BBB      3     23       7
    6   CCC      1     31       9
    7   CCC      2     32      10
    8   CCC      3     33      11

我将 df 旋转如下,结果如下所示:

df2 = pd.pivot_table(df, values=['Price','Change'], index='Tenor',columns='Curve', aggfunc=np.mean)

          Change         Price        
    Curve    AAA BBB CCC   AAA BBB CCC
    Tenor                             
    1          1   5   9    11  21  31
    2          2   6  10    12  22  32
    3          3   7  11    13  23  33

我希望它更改列分组的顺序,使其看起来像

        AAA             BBB             CCC 
Tenor   Price   Change  Price   Change  Price   Change
1        11     1       5       21      31      9
2        12     2       6       22      32      10
3        13     3       7       23      33      11

在 XLS 中,您只需在 Pivot 中物理移动字段。我敢肯定它在这里也同样微不足道:) 但无论我如何谷歌,我似乎都找不到解决方案。再次感谢你的帮助!任何和所有的帮助表示赞赏。干杯。

【问题讨论】:

【参考方案1】:

我们可以通过swaplevelsort_indexreindex 重新组织标题:

df2 = (
    df.pivot_table(values=['Price', 'Change'], index='Tenor', columns='Curve')
        .swaplevel(axis=1)
        .sort_index(level=0, axis=1)
        .reindex(['Price', 'Change'], level=1, axis=1)
        .rename_axis(columns=[None, None])
)

df2:

        AAA          BBB          CCC       
      Price Change Price Change Price Change
Tenor                                       
1        11      1    21      5    31      9
2        12      2    22      6    32     10
3        13      3    23      7    33     11
    swaplevel切换0级和1级的值(所以AAA、BBB、CCC成为***索引) sort_index 将按字典顺序对新的*** AAA BBB CCC 进行排序(我们也可以使用 .reindex(['AAA', 'BBB', 'CCC'], level=0, axis=1) 来为该级别提供特定的顺序。) reindex 需要将“价格”放在“更改”之前,因为排序不起作用,因为“更改”按字母顺序排在“价格”之前 rename_axis 去掉旋转时创建的轴名称“Curve”。

【讨论】:

感谢您的帮助。这很好用!我有一个稍微复杂的支点来创建一个我遇到类似问题的报告。 ***.com/questions/69951324/…

以上是关于Python Pandas Dataframe 数据透视表列和值顺序的主要内容,如果未能解决你的问题,请参考以下文章

Pandas - 在 DataFrame 中的任何位置查找值索引

python pandas dataframe 写入hdfs

Pandas DataFrame 中每月平均每日记录数

14Pandas 百题大冲关

python:pandas之DataFrame取行列(df.loc(),df.iloc())以及索引

python - 如何将带有年份的周数转换为python pandas中的日期时间格式?