Pandas分组统计与时间序列
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas分组统计与时间序列相关的知识,希望对你有一定的参考价值。
参考技术A 1.创建分组2.显示分组内容
3.分组对象的统计方法
直接执行describe()操作
或者用g.agg()传递多个指定的统计函数
4.数据透视表
数据透视表功能类似于Excel中的数据透视表功能
1.to_datetime()
作用:①将字符串转换为时间值
②将索引数据转换为日期型
2.date_range()
作用:产生一系列的日期值
date_range(起始日期,结束日期,periods=周期数,freq=日期频率)
方法:
参考及引用:
1. Pandas分组函数:groupby、pivot_table及crosstab - (jianshu.com)
2. pandas属性和方法 - Hany驿站 - 博客园 (cnblogs.com)
3. pandas date_range freq 参数的详细描述。_阿浪丶的博客-CSDN博客
4. Pandas中resample方法详解 python 脚本之家 (jb51.net)
Pandas - 分组统计
参考技术A 首先,导入 pandas 模块,构建一个 DataFrame 结构:上述 DataFrame 包含两个列,分别是 key 和 data :
显然, key 列由 3 种数据组成,分别是 A B C ,下面我们希望分别计算 A B C 三类数据的 data 之和。
df['key'] == key 返回布尔类型的 Series 结构,随后作为布尔索引传入 df.loc[df['key'] == key,'data'] ,上述分组计算结果:
由于分组统计是数据分析中常用的操作,为此 pandas 为我们提供了 groupby 方法,来方便地进行分组,在分组结果上可以应用 sum mean count 等统计计算方法。
分组计算结果:
还可以在分组结果上调用 aggregate 方法以应用 numpy 中的数学统计函数:
下面,我们以泰坦尼克号提供的登船信息数据集为例,进一步感受分组统计的用法。首先,读取数据集:
数据集内容:
分别统计男性乘客和女性乘客年龄的平均值:
分别统计男性乘客和女性乘客获救的比例:
分别统计各等级船舱的价格总和:
以上是关于Pandas分组统计与时间序列的主要内容,如果未能解决你的问题,请参考以下文章
pandas使用groupby函数按照多个分组变量进行分组聚合统计使用agg函数计算分组的多个统计指标(grouping by multiple columns in dataframe)
pandas使用groupby函数基于指定分组变量对dataframe数据进行分组使用agg函数计算每个分组不同数值变量的聚合统计值agg参数为字典指定不同变量的聚合计算统计量的形式