pandas_查看数据特征和统计信息

Posted hany-postq473111315

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas_查看数据特征和统计信息相关的知识,希望对你有一定的参考价值。

# 查看数据特征和统计信息
import pandas as pd
# 读取文件
dataframe = pd.read_excel(rC:UserslenovoDesktop总结Python超市营业额.xlsx)

# 查看所有的交易额信息
dataframe[交易额].describe()
‘‘‘
count      17.000000
mean     1024.117647
std       428.019550
min       580.000000
25%       700.000000
50%       850.000000
75%      1300.000000
max      2000.000000
Name: 交易额, dtype: float64
‘‘‘
# 查看四分位数
dataframe[交易额].quantile([0,0.25,0.5,0.75,1.0])
‘‘‘
0.00     580.0
0.25     700.0
0.50     850.0
0.75    1300.0
1.00    2000.0
Name: 交易额, dtype: float64
‘‘‘
# 交易额中值
dataframe[交易额].median()
# 850.0

# 交易额最小的三个数据
dataframe[交易额].nsmallest(3)
‘‘‘
12    580
4     600
7     600
Name: 交易额, dtype: int64
‘‘‘
dataframe.nsmallest(3,交易额)
‘‘‘
      工号  姓名        日期           时段  交易额    柜台
12  1005  周七  20190302   9:00-14:00  580   日用品
4   1005  周七  20190301   9:00-14:00  600   日用品
7   1001  张三  20190302  14:00-21:00  600  蔬菜水果
‘‘‘
# 交易额最大的两个数据
dataframe[交易额].nlargest(2)
‘‘‘
0    2000
1    1800
Name: 交易额, dtype: int64
‘‘‘
# 查看最大的交易额数据
dataframe.nlargest(2,交易额)
‘‘‘
     工号  姓名        日期           时段   交易额   柜台
0  1001  张三  20190301   9:00-14:00  2000  化妆品
1  1002  李四  20190301  14:00-21:00  1800  化妆品
‘‘‘
# 查看最后一个日期
dataframe[日期].max()
# 20190303

# 查看最小的工号
dataframe[工号].min()
# 1001

# 第一个最小交易额的行下标
index = dataframe[交易额].idxmin()
# 0

# 第一个最小交易额
dataframe.loc[index,交易额]
# 580

# 最大交易额的行下标
index = dataframe[交易额].idxmax()
dataframe.loc[index,交易额]
# 2000

2020-05-07

以上是关于pandas_查看数据特征和统计信息的主要内容,如果未能解决你的问题,请参考以下文章

Pandas 数据清洗常见方法

pandas数据分析

pandas使用resample进行不同粒度下的时间特征重构实战:构建时间维度统计特征

学习pandas全套代码超详细数据查看输入输出选取集成清洗转换重塑数学和统计方法排序

数据分析与展示——Pandas数据特征分析

推荐 3 个Pandas数据探索分析神器