在 Python 中获取数据透视表列之间的差异

Posted

技术标签:

【中文标题】在 Python 中获取数据透视表列之间的差异【英文标题】:Take difference between pivot table columns in Python 【发布时间】:2020-03-28 06:57:03 【问题描述】:

我有一个带有 Week 、 Campaign 、 Placement 和 Count 列的数据框。

为了按广告系列和展示位置比较每周计数,我创建了一个效果很好的数据透视表。如何创建一个包含这 2 周之间差异的新列(如果可能,以百分比表示)?

代码:

dfPivot = pd.pivot_table(dfPivot, values='Count',\
                           index=['Campaign', 'Placement'],columns=['Week'], aggfunc=np.sum)

电流输出:

                      Week  2019-10-27  2019-11-03
Campaign    Placement Code      
A              111111111        4288.0    615.0
               111111112         243.0    11.0
               111111113         598.0    30.0
               111111114        1041.0    377.0
               111111115        7759.0    161.0
B              111111111        1252.0    241.0
               111111112         643.0    124.0
               111111113         135.0    30.0
               111111114        8753.0    2327.0
               111111115        7242.0    112.0

预期输出:

                      Week  2019-10-27  2019-11-03  Difference
Campaign    Placement Code      
A              111111111        4288.0    615.0     -85.7%
               111111112         243.0    11.0      -95.4%
               111111113         598.0    30.0      -94.9%
               111111114        1041.0    377.0     [...]
               111111115        7759.0    161.0     [...]
B              111111111        1252.0    241.0     [...]
               111111112         643.0    124.0     [...]
               111111113         135.0    30.0      [...]
               111111114        8753.0    2327.0    [...]
               111111115        7242.0    112.0     [...]

谢谢!

【问题讨论】:

【参考方案1】:

使用DataFrame.pct_change 按位置选择最后一行,按100 选择多个百分比:

df['diff'] = df.pct_change(axis=1).iloc[:, -1].mul(100)
print (df)
                         2019-10-27  2019-11-03       diff
Campaign Placement Code                                   
A        111111111           4288.0       615.0 -85.657649
         111111112            243.0        11.0 -95.473251
         111111113            598.0        30.0 -94.983278
         111111114           1041.0       377.0 -63.784822
         111111115           7759.0       161.0 -97.924990
B        111111111           1252.0       241.0 -80.750799
         111111112            643.0       124.0 -80.715397
         111111113            135.0        30.0 -77.777778
         111111114           8753.0      2327.0 -73.414829
         111111115           7242.0       112.0 -98.453466

【讨论】:

以上是关于在 Python 中获取数据透视表列之间的差异的主要内容,如果未能解决你的问题,请参考以下文章

无论如何要在 Python 中重新排序数据透视表列?

过滤数据透视表列,仅在

如何对 Eloquent 关系中的数据透视表列进行 GROUP 和 SUM?

SQL 动态数据透视表列顺序

数据透视表列重命名

MySQL 数据透视表列数据作为行