python数据分析与展示
Posted bupt-mrwu
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python数据分析与展示相关的知识,希望对你有一定的参考价值。
NumPy库学习
一.数据的维度
数据的维度是数据的组织形式。
- 一维数据:由对等关系的有序或无序数据构成,采用线性方式组织。例如列表和数组,这两者的区别是列表的数据类型可以不同,数组的数据类型必须相同。
- 二维数据:由多个一维数据构成,是一维数据的组合形式。例如表格是典型的二位数据。
- 多维数据:由一维或二维数据在新维度上扩展形成
- 高维数据:仅利用最基本的二元关系展示数据间的复杂结构。例如json、yaml格式的数据。
二.数据维度的python表示
#一维数据:列表和集合类型 [1,2,3] #有序 1,2,3 #无序 #二维数据:列表类型 [[1,2,3], [4,5,6]] #多维数据 [[[1,2,3], [4,5,6]], [7,8,9], [4,4,4]] #高维数据:字典类型或数据表示格式,例如JSON、XML、YAML dict= ‘firstName‘:‘Tian‘, ‘lastName‘:‘Song‘,
三.NumPy的多维数组对象:ndarray
1.NumPy是一个开源的python科学计算基础库,包含:
- 一个强大的N维数组对象:ndarray
- 广播功能函数
- 整合C/C++/Fortran代码的工具
- 线性代数,傅里叶变换、随机数生成等功能
NumPy是SciPy、Pandas等数据处理或科学计算库的基础
2.NumPy的引用:
import numpy as np #这是一种约定俗成的引用名称,建议使用上述约定的别名
3.python已经有列表类型,为什么需要一个数组对象?
- 数组对象可以去除元素运算所需的循环,使一维向量更像单个数据
- 设置专门的数组对象,经过优化,可以提升这类应用的运算速度
- 数组对象采用相同的数据类型,有助于节省运算和存储空间
例如以下事例:
#计算A^2+B^2,其中A和B是一维数组 import numpy as np #使用列表的方式 def pySum(): a=[0,1,2,3,4] b=[5,6,7,8,9] c=[] for i in range(len(a)): c.append(a[i]**2+b[i]**2) return c print("pySum-->",pySum()) #使用数组的方式 def npSum(): a=np.array([0,1,2,3,4]) b=np.array([5,6,7,8,9]) c=a**2+b**2 return c print("npSum-->",npSum()) #运行结果 ‘‘‘ pySum--> [25, 37, 53, 73, 97] npSum--> [25 37 53 73 97] ‘‘‘ #可见如果采用数组的方式,numy把一维向量当作单个数据对待,这样更有利于进行科学计算
4.ndarray对象的构成:
- 实际的数组
- 描述这些数据的元数据(数据维度、数据类型等)
ndarray数组一般要求所有元素类型相同(同质),数组下标从0开始
ndarry实例:
import numpy as np #ndarray在程序中的别名是:array #np.array()生成一个ndarray数组 a=np.array([[0,1,2,3,4], [5,6,7,8,9]]) print(a) #np.array()输出成[]形式,元素有空格分割 ‘‘‘ [[0 1 2 3 4] [5 6 7 8 9]] ‘‘‘ #轴(axis):保存数据的维度;秩(rank):轴的数量
5.ndarray对象的属性
- .ndim:秩,即轴的数量或维度的数量
- .shape:ndarray对象的尺度,对于矩阵的n行m列
- .size:ndarray对象元素的个数,相当于.shape中的n*m的值
- .dtype:ndarray对象的元素类型
- .itemsize:ndarray对象中每个元素的大小,以字节为单位
实例:
import numpy as np a=np.array([[1,2,3,4], [5,6,7,8]]) print("维度:",a.ndim) print("尺度:",a.shape) print("元素个数:",a.size) print("元素的类型:",a.dtype) print("元素的大小:",a.itemsize) ‘‘‘ 维度: 2 尺度: (2, 4) 元素个数: 8 元素的类型: int32 元素的大小: 4 ‘‘‘
6.ndarray的元素类型
ndarrya为什么要支持这么多种元素类型?
- 科学计算涉及数据较多,对存储和性能都有较高要求
- 对元素类型精确定义,有助于NumPy合理使用存储空间并优化性能
- 对元素类型精确定义,有助于程序员对程序规模有合理评估
7.非同质的ndarray对象
非同质的ndarray元素为对象类型,无法有效发挥NumPy优势,尽量避免使用
import numpy as np a=np.array([[1,2,3,4], [5,6,7]]) print("尺度:",a.shape) print("元素个数:",a.size) print("元素的类型:",a.dtype) print("元素的大小:",a.itemsize) ‘‘‘ 尺度: (2,) 元素个数: 2 元素的类型: object 元素的大小: 8 ‘‘‘ #此时每个一维向量被当成一个对象(元素)
8.ndarray数组的创建
(1)从python中的列表、元组等类型创建ndarray数组
x=np.array(list/tuple,dtype=np.float32) #当np.array()不指定dtype时,NumPy将根据情况关联一个dtype类型
例子:
(2)使用NumPy中函数创建ndarray数组,如:arrange,ones,zeros
#######
注:使用np.arange()方法创建的数组默认是int32类型,另外几种方法默认是float类型
例子:
例子:
例子:
9.ndarray数组的变换
(1)ndarray数组的维度变换
例子:
(2)ndarray数组的类型变换
new_a = a.astype(new_type)
#astype()方法一定会创建新的数组()原始数组的一个拷贝,即使两个类型一致
例子:
(3)ndarray数组向列表的转换
ls=a.tolist()
例子:
10.ndarray数组的操作
(1)ndarray数组的索引和切片
一维数组的索引和切片:与python的列表类似
多维数组的索引:
多维数组的切片:
(2)ndarray数组的运算
数组与标量之间的运算作用于数组的每一个元素
(3)NumPy一元函数
例子:
(4)NumPy二元函数
例子:
以上是关于python数据分析与展示的主要内容,如果未能解决你的问题,请参考以下文章