pandas_查看数据特征和统计信息
Posted hany-postq473111315
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas_查看数据特征和统计信息相关的知识,希望对你有一定的参考价值。
# 查看数据特征和统计信息
import pandas as pd
# 读取文件
dataframe = pd.read_excel(r‘C:UserslenovoDesktop总结Python超市营业额.xlsx‘)
# 查看所有的交易额信息
dataframe[‘交易额‘].describe()
‘‘‘
count 17.000000
mean 1024.117647
std 428.019550
min 580.000000
25% 700.000000
50% 850.000000
75% 1300.000000
max 2000.000000
Name: 交易额, dtype: float64
‘‘‘
# 查看四分位数
dataframe[‘交易额‘].quantile([0,0.25,0.5,0.75,1.0])
‘‘‘
0.00 580.0
0.25 700.0
0.50 850.0
0.75 1300.0
1.00 2000.0
Name: 交易额, dtype: float64
‘‘‘
# 交易额中值
dataframe[‘交易额‘].median()
# 850.0
# 交易额最小的三个数据
dataframe[‘交易额‘].nsmallest(3)
‘‘‘
12 580
4 600
7 600
Name: 交易额, dtype: int64
‘‘‘
dataframe.nsmallest(3,‘交易额‘)
‘‘‘
工号 姓名 日期 时段 交易额 柜台
12 1005 周七 20190302 9:00-14:00 580 日用品
4 1005 周七 20190301 9:00-14:00 600 日用品
7 1001 张三 20190302 14:00-21:00 600 蔬菜水果
‘‘‘
# 交易额最大的两个数据
dataframe[‘交易额‘].nlargest(2)
‘‘‘
0 2000
1 1800
Name: 交易额, dtype: int64
‘‘‘
# 查看最大的交易额数据
dataframe.nlargest(2,‘交易额‘)
‘‘‘
工号 姓名 日期 时段 交易额 柜台
0 1001 张三 20190301 9:00-14:00 2000 化妆品
1 1002 李四 20190301 14:00-21:00 1800 化妆品
‘‘‘
# 查看最后一个日期
dataframe[‘日期‘].max()
# 20190303
# 查看最小的工号
dataframe[‘工号‘].min()
# 1001
# 第一个最小交易额的行下标
index = dataframe[‘交易额‘].idxmin()
# 0
# 第一个最小交易额
dataframe.loc[index,‘交易额‘]
# 580
# 最大交易额的行下标
index = dataframe[‘交易额‘].idxmax()
dataframe.loc[index,‘交易额‘]
# 2000
2020-05-07
以上是关于pandas_查看数据特征和统计信息的主要内容,如果未能解决你的问题,请参考以下文章
pandas使用resample进行不同粒度下的时间特征重构实战:构建时间维度统计特征