数据分析&数据挖掘pandas的统计分析

Posted tree0108

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析&数据挖掘pandas的统计分析相关的知识,希望对你有一定的参考价值。

 1 # 在numpy 里面有统计分析, 对数值型数据进行统计指标
 2 # np.max  np.min  np.mean np.std‘
 3 
 4 import pandas  as pd
 5 import numpy as np
 6 
 7 # 1、加载数据
 8 detail = pd.read_excel("../day05/meal_order_detail.xlsx")
 9 # print("detail :
", detail)
10 print("detail 的类型:
", type(detail))
11 print("detail 列索引名称:
", detail.columns)
12 print("detail 的元素的数据类型:
", detail.dtypes)
13 
14 # 在pandas里面对数值型数据进行统计分析
15 # 获取 amounts counts 的统计指标
16 print("获取最大值:
",detail.loc[:,["amounts","counts"]].max())
17 print("获取最小值:
",detail.loc[:,["amounts","counts"]].min())
18 print("获取均值:
",detail.loc[:,["amounts","counts"]].mean())
19 print("获取中位数:
",detail.loc[:,["amounts","counts"]].median())
20 print("获取标准差:
",detail.loc[:,["amounts","counts"]].std())
21 print("获取方差:
",detail.loc[:,["amounts","counts"]].var())
22 print("获取非空数据的数量:
",detail.loc[:,["amounts","counts"]].count())
23 print("获取最大值的位置:
",detail.loc[:,["amounts","counts"]].idxmax())  # np.argmax()
24 print("获取最小值的位置:
",detail.loc[:,["amounts","counts"]].idxmin()) # np.argmin()
25 
26 
27 # 返回一个众数的dataframe
28 res = detail.loc[:,["amounts","counts"]].mode()
29 print("res: 
", res)
30 print("获取amounts众数
",res["amounts"])
31 print("获取counts众数
",res["counts"])
32 print("获取众数的类型
",type(res))
33 # 返回一个 众数的 series
34 print("获取众数
",detail.loc[:,"amounts"].mode())
35 
36 # 获取分位数
37 # 默认获取 50% 的分位数---即 中位数
38 print("获取分位数:
", detail.loc[:, ["amounts", "counts"]].quantile())
39 # # 获取四分位数 --通过给q 传参来获取四分位数
40 print("获取分位数:
", detail.loc[:, ["amounts", "counts"]].quantile(q=np.arange(0, 1 + 0.25, 0.25)))
41 
42 
43 # 获取describe 统计分析
44 # 返回8中结果
45 # 非空数量
46 # 均值
47 # 标准差
48 # 最小值
49 # 分位数
50 # 最大值
51 print("获取describe 统计分析:
", detail.loc[:, ["amounts", "counts"]].describe())
52 
53 # 也可以对非数值型数据进行统计分析 ---使用describe对于非数值型数据进行统计分析
54 # 返回4种结果
55 # 非空数据的数量
56 # 去重之后的数据数量
57 # 众数
58 # 众数出现的次数
59 # 在统计分析之前将数据转化为类别型数据---category
60 # 可以使用astype 来修改数据类型
61 detail.loc[:, "dishes_name"] = detail.loc[:, "dishes_name"].astype("category")
62 # #
63 # # #
64 print("修改数据类型之后的detail :
", detail.dtypes)
65 # #
66 print("获取非数值型数据的describe 统计分析:
", detail.loc[:, "dishes_name"].describe())
67 
68 # 1、利用统计分析,以及dataframe的删除方式,删除detail里面数据全是空的列
69 # 2、梳理pandas的xmind
70 # 3、掌握numpy、matplotlib、pandas 的所学操作

以上是关于数据分析&数据挖掘pandas的统计分析的主要内容,如果未能解决你的问题,请参考以下文章

数据分析&数据挖掘pandas时间数据

数据分析&数据挖掘pandas数据合并

数据分析&数据挖掘pandas去空方法——删除法&保留法

数据分析&数据挖掘pandas——文件的读取与保存

python中数据分析库的基本使用(series&pandas)

python中数据分析库的基本使用(series&pandas)