Pandas玩转数据透视表，用它就够了~

Posted 2022-11-12 Dream丶Killer

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Pandas玩转数据透视表，用它就够了~相关的知识，希望对你有一定的参考价值。

大家好，我是丁小杰。

对于数据透视表，相信对于 Excel 比较熟悉的小伙伴都知道如何使用它，并了解它的强大之处，而在pandas中要实现数据透视就要用到pivot_table了。

导入示例数据

首先导入演示的数据集。

import pandas as pd

df = pd.read_csv('销售目标.csv')
df.head()

参数说明

主要参数：

data：待操作的 DataFrame
values：被聚合操作的列，可选项
index：行分组键，作为结果 DataFrame 的行索引
columns：列分组键，作为结果 DataFrame 的列索引
aggfunc：聚合函数/函数列表，默认 numpy.mean 这里要注意如果 aggfunc 中存在函数列表，则返回的 DataFrame 中会显示函数名称
fill_value：默认 None，可设定缺省值
dropna：默认 True，如果列的所有值都是 NaN，将被删除；False 则保留
margins：默认 False，设置为 True 可以添加行/列的总计
margins_name：默认显示 ‘ALL’，当 margins = True 时，可以设定 margins 行/列的名称

常用操作

使用pivot_table时必须要指定index，因为计算时要根据index进行聚合。

pd.pivot_table(df.head(20),
               index='订单日期',
               aggfunc=np.sum)

通过指定value来选择被聚合的列。

pd.pivot_table(df.head(20),
               values='销售目标',
               index='订单日期',
               aggfunc=np.sum)

当只指定index进行聚合时，其实用groupby可以实现同样的效果。

df.head(20).groupby(['订单日期'])['销售目标'].sum().reset_index()

添加columns参数，对列分组。

pd.pivot_table(df.head(10),
               values='销售目标',
               index=['订单日期', '类别'],
               columns='细分',
               aggfunc=np.sum)

对于上面结果中的空值，使用fill_value参数统一填充为0

pd.pivot_table(df.head(10),
               values='销售目标',
               index=['订单日期', '类别'],
               columns=['细分'],
               aggfunc=np.sum,
               fill_value=0)

现在按年份来统计销售数据，注意此时的aggfunc参数，当参数值包含列表时，在结果DataFrame中就会显示函数名称。

pd.pivot_table(df,
               values='销售目标',
               index=['年份', '类别'],
               columns='细分',
               aggfunc=[np.sum])

如果需要添加合计列，只需指定margins=True即可，同时根据需要指定合计名称。

pd.pivot_table(df,
               values='销售目标',
               index=['年份', '类别'],
               columns='细分',
               aggfunc=np.sum,
               margins=True,
              margins_name='合计')

当然与groupby类似，对于计算函数我们可以同时指定多种方式。

pd.pivot_table(df,
               values='销售目标',
               index=['年份', '类别'],
               columns=['细分'],
               aggfunc='销售目标': [max, np.sum],
               fill_value=0)

以上就是pandas数据透视的常用操作了，使用起来也是十分简单，大家可以自己练习一下，如果文章对你有帮助，请点赞支持一下哦！

对于刚入门 Python 或是想要入门 Python 的朋友，可以通过关注公众号“Python新视野”，一起交流学习，都是从新手走过来的，有时候一个简单的问题卡很久，但可能别人的一点拨就会恍然大悟，由衷的希望大家能够共同进步。

👇🏻 关注公众号卡片，回复“交流群”，一起学习Python👇🏻

以上是关于Pandas玩转数据透视表，用它就够了~的主要内容，如果未能解决你的问题，请参考以下文章