数据分析&数据挖掘numpypandas&matplotlib

Posted tree0108

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析&数据挖掘numpypandas&matplotlib相关的知识,希望对你有一定的参考价值。

 1 import numpy as np
 2 import pandas as pd
 3 
 4 """
 5     numpy --科学计算库
 6     核心---ndarray
 7     本质: 存储单一数据类型的 内存连续的 N维数组
 8      C  F 风格存储
 9      
10     matplotlib ---数据可视化的库
11     能绘制2-D  与 3-D 图形
12     
13     pandas ----进行数据处理的库
14     里面封装了部分numpy  与matplotlib 功能
15     结构核心:
16     常用两种结构:
17     series  --存储一维结构
18     与dataframe相比,只含有行索引,没有列索引
19     dataframe(重中之重)----存储二维结构
20     数据相比ndarray  多了行索引、与列索引
21 """
22 
23 # 将columns 与 values 合并为同一个数据----合并结果什么类型---数组
24 res = np.load("./国民经济核算季度数据.npz")
25 columns = res["columns"]
26 values = res["values"]
27 
28 print("columns :
", columns)
29 print("values :
", values)
30 # print("*" * 100)
31 # #
32 # # numpy合并数据
33 res_array = np.concatenate((columns.reshape(1,-1), values), axis=0)
34 # print("res_array:
",res_array)
35 
36 
37 # 将数组转化为dataframe
38 # 将 上面的columns  与 values 转化为pandas 中的dataframe结构
39 # data----真实数据
40 # index ---行索引的名称
41 # columns ---列索引的名称
42 index = ["index_"+ str(i) for i  in range(values.shape[0])]
43 print(index)
44 
45 res_df = pd.DataFrame(data=values, columns=columns,index=index)
46 print("res_df:
", res_df)
47 
48 # # 自己创建一个df
49 df = pd.DataFrame(
50     data={
51         "name": ["zs", "ls", "ww"],
52         "score": [97, 89, 92.5],
53         "age": [21, 22, 23]
54     },
55     index=["stu_1", "stu_2", "stu_3"]
56 )
57 print("df:
", df)
58 
59 print("df 的维度:
", df.ndim)
60 print("df的类型:
", type(df))
61 
62 # print("*" * 100)
63 
64 # 将dataframe 转化为series
65 # series ???
66 se = df["name"]
67 
68 print("se:
",se)
69 
70 print("se 的类型:
",type(se))
71 
72 # 自己创建series
73 # data --series 真实的值
74 se = pd.Series(
75     data=["zs","ls","ww"],
76     index=["stu_1","stu_2","stu_3"]
77 )
78 print("se:
",se)
79 print("se 的维度:
",se.ndim)
80 print("se 的类型:
",type(se))
81 
82 
83 # numpy
84 arr = np.array([1,2,3,4])  # 将简单列表转化为数组
85 arr = np.array([[1,2,3,4],[2,3,4,5]])  # 将列表嵌套转化为数组
86 arr = np.array([[[1,2,3,4],[2,3,4,5]],[[1,2,3,4],[2,3,4,5]]])
87 
88 print(arr:
,arr)
89 print(arr的类型:
,type(arr))  # <class ‘numpy.ndarray‘>
90 print(arr的维度: , arr.ndim)
91 print(arr的形状: , arr.shape)
92 print(arr的大小: , arr.size)
93 print(arr元素的数据类型: , arr.dtype)
94 print(arr每一个元素的大小 :, arr.itemsize)

以上是关于数据分析&数据挖掘numpypandas&matplotlib的主要内容,如果未能解决你的问题,请参考以下文章

numpypandas做数据清洗

机器学习NumPyPanda相关数据结构学习

学习(13)-NumpyPandas

Windows下下载及安装numpypandas及简单应用

数据分析1

python包依赖关系